حفظ حریم خصوصی در شهرهای هوشمند
چگونه میتوانیم حریم خصوصی شخصی را در سراسر یک شهر هوشمند که بر تسهیم سریع دادهها و تکنیکهای داده کاوی با چند ذینفع اتکا دارد تضمین کنیم ؟ در این مقاله به موضوع حفظ حریم خصوصی در شهرهای هوشمند خواهیم پرداخت.
بنابر ماهیت ارتباط داخلی شهر هوشمند، دادهها در سراسر فرایندهای شهر هوشمند انتقال یافته و با برقراری ارتباط بین چند نفر که به اطلاعات دسترسی پیدا میکنند بکار میروند. از سازندگان حسگرهای هوشمند، تا متصدی حمل و نقل شهر، و افرادی که از طریق تلفنهای هوشمند به شهرهای هوشمند دسترسی پیدا میکنند، هر سازمان شرکت کننده در شهر هوشمند بطور منحصربفردی از دادهها استفاده میکند، بطوریکه ممکن است حریم شخصی را به خطر بیندازد. علاوه براین، از آنجاییکه هر یک از ذینفعان شهر هوشمند دارای اولویتهای متفاوتی هستند، شکافهایی بین استانداردهای مختلف حریم خصوصی ذینفعان وجود خواهد داشت.
هم اکنون تفاوتهایی در استانداردهای حریم خصوصی بین بخشهای خصوصی و دولتی بر اساس اهداف منحصربفرد این دو بخش وجود دارد. کسب و کارها در زمان تصمیم گیری در مورد میزان مناسب پشتیبانی حریم خصوصی، سود/ ریسک را مورد ارزیابی قرار میدهند . هدف کسب و کارها سودآوری با ارائه محصول یا خدمات است، بطوریکه شرکتها به اندازه کافی از حریم خصوصی پشتیبانی میکنند تا مطمئن شوند برند آنها خدشه دار نشده و مشتریان همچنان به خرید محصولات آنها ادامه میدهند . از طرف دیگر، سازمانهای بخش دولتی مانند ارائه دهندگان مراقبتهای بهداشتی یا متصدیان حمل و نقل، همچنان خدمات عمومی را به نفع عموم ارائه میدهند . بخش دولتی احتمالاً دارای دامنه قاطعتری از آنچه حفظ حریم خصوصی را تشکیل میدهد میباشد، اما بر خلاف بخش خصوصی، تأمین بودجه و درآمد آن مستقیماً به موفقیت در دستیابی به حفظ حریم خصوصی بستگی ندارد. این شکاف در محافظت از شهرهای هوشمند هیچ تفاوتی ندارد، اما با شروط بالاتری همراه خواهد بود. برای مثال، مراقبتهای بهداشتی در شهر هوشمند ممکن است بر مشارکت یکپارچه بین صنایع خصوصی و دولتی متکی باشد. درحالیکه یک بیمارستان دولتی ممکن است خدمات مراقبت از بینایی را ارائه دهد و یک تصمیم گیرنده مرکزی باشد، توزیع بیماران و دارو بین مراکز میتواند بطور موثری از طریق مشارکت بخش خصوصی انجام شود. در چنین سناریویی، اطلاعات حساس در مورد شرایط یک بیمار، برنامه درمانی، و آدرس خانه باید توسط اشخاص مربوطه انتقال یافته و مورد تجزیه و تحلیل قرار گیرد.
این فرایند انتقال دادهها بین سازمانهای متعدد برای یک هدف مشترک اغلب منجر به ایجاد تکنیکهایی به نام سرویس ترکیبی دادهها و تلفیق دادهها میشود. سرویس ترکیبی دادهها به پیوند ساده دو یا چند مجموعه دادهها با یک موضوع مشترک مورد نظر اشاره دارد، درحالیکه تلفیق دادهها چند مجموعه دادهها را به گونهای به هم پیوند میدهد که دادههای موجود تغییر میکنند. در یک محیط شهر هوشمند، سرویس ترکیبی دادهها با ابعاد بالا در حفظ حریم خصوصی به چند نفر از طرفین این امکان را میدهد که به دادههای مربوطه دسترسی پیدا کنند و آنها را بدون به خطر انداختن حریم خصوصی افراد به اشتراک بگذارند. به هر حال، شیوههای کنونی سرویس ترکیبی دادهها دارای چالشهای مختص به خود است.
Fung و همکاران سه مسئله حریم خصوصی را توضیح میدهند که در سرویس ترکیبی دادههای خصوصی با ابعاد بالا اتفاق می افتند. اولاً، با ترکیب چند مجموعه از دادههای حریم خصوصی با هم، مجموعه حاصل شده اطلاعات حساستری را برای سایر ارائه دهندگان دادهها بازگو میکند. ثانیاً، مجموعه دادههای تلفیق شده میتواند با فراهم آوردن نقطه دادههای بیشتری شناسایی افراد را در شناسایی مجدد آنها آسانتر کند. برای مثال، به سادگی با دانستن اینکه یک وکیل سی ساله که دارای لوسمی است کمک خود را به یک شاکی بدخواه قطع نمیکند، نشان میدهد که بیمار سرطان دارد، اما دانستن اینکه یک وکیل ۳۰ ساله در دوم آوریل در Burlington، Vermont متولد شده دارای لوسمی است میتواند یه یک شخص واحد برگردد. ثالثاً، دادههای ترکیبی از چند منبع ممکن است حاوی ویژگیهای دادههای بسیار زیادی باشند که مدلهای متعارف حریم خصوصی، مثل مدل بی نامی-K دادههای محافظت شده را برای تجزیه و تحلیل بی فایده نشان میدهد. مدل حریم خصوصی بی نامی K دارای مجموعه دادههایی با چند ویژگی است و بنابراین ارزشهای خاصی را در این ویژگیها تعمیم میدهد تا شناسههای فردی را بدون به خطر انداختن سودمندی اطلاعات برای تجزیه و تحلیل طبقه بندی پنهان کند . برای مثال، بجای نشان دادن اینکه یک وکیل ۳۰ ساله از Burlington، Vermont لوسمی دارد، پایگاه دادهها میتواند برای آن آیتم تعمیم یابد تا نشان دهد که یک متخصص ۲۰-۳۰ ساله از Vermont دارای لوسمی است. با این وجود، زمانیکه یک مجموعه دادهها مثل مجموعه دادهها در شهرهای هوشمند شامل متغیرهای زیادی باشند که بتوانند یک فرد را شناسایی کنند، روشهای تعمیم بقدری گسترده میشوند که دادههای تغییر یافته را برای تجزیه و تحلیل غیرقابل استفاده میکند. همچنین، مدلهای حریم خصوصی مبتنی بر جزءبندی مانند مدل بی نامی-K در برابر حملات حریم خصوصی از جمله حملات deFinetti ، حملات ترکیبی ، و حملات دانش پیش زمینه آسیب پذیرند، که در آن مهاجم دارای کمی اطلاعات پیش زمینه در مورد افراد در مجموعه دادهها میباشد .
شهرهای هوشمند نمیتوانند در زمان تنظیم یا سهیم شدن در ترکیب دادهها، بر روشهای متعارف حفظ حریم خصوصی اتکا داشته باشند. علاوه براین، در زمان پیش بینی حملات خصوصی، فرضیههای دانش دشمن میتواند برای امنیت خصوصی مضر باشد. بنابراین، زمانیکه این روشها برای حفظ حریم خصوصی افراد در مجموعه دادههای شهر هوشمند مورد نظر قرار میگیرند، مفهوم حریم خصوصی متمایز باید مد نظر قرار گیرد. حریم خصوصی متمایز به عنوان یکی از قویترین مدلهای حریم خصوصی در نظر گرفته شده است زیرا به لحاظ تجربی حریم خصوصی را صرف نظر از دانش پیش زمینه و توان محاسباتی مهاجم تضمین میکند . تکنیکهای ساده تجمیع و تعمیم با مدل بی نامی K در حفظ مجموعه دادهها با ابعاد بالا نمیتوانند سودمند باشند. جمع آوری دادهها میتواند برای جلوگیری از استراق سمع و تجزیه و تحلیل ترافیک در ابزارسنجهای هوشمند سودمند باشد . اطلاعات محرمانه میتوانند از دستگاههای ابزارسنج هوشمند که میتوانند اندازههای دقیق را با مهرهای زمانی ثبت کنند استخراج شوند ، مثل مصرف برق، گرما، یا اینترنت . و در حالیکه این اطلاعات مفید از طریق کانالهای شهر هوشمند منتقل میشوند، خطر جلوگیری و یا استفاده از آنها برای ورود به اطلاعات محرمانه وجود دارد.
روش دیگری برای مورد خطاب قرار دادن مسئله حریم خصوصی دادهها با ابعاد بالا، اجرای تجزیه و تحلیل در مورد کاهش تعداد ویژگیها است، به این معنی که مستلزم مرحله پیش پردازش انتخاب ویژگیها میباشد. چالش این است که فرایند انتخاب ویژگیها به تنهایی ممکن است موجب تهدیدات حریم خصوصی شود. بنابراین، یک مسیر برای کار وجود دارد که بر کاهش انتخاب یک مجموعه از ویژگیهای مرتبط به روش حفظ حریم خصوصی تمرکز دارد.