مایکروسافت خانه تیمی متنوع از محققان است که بر حمایت از یک جامعه جهانی سالم متمرکز شدهاند، از جمله یافتن راههایی که فناوری میتواند مشکلات حقوق بشری را که آسیبپذیرترین جمعیتها را در سراسر جهان تحت تأثیر قرار میدهند، برطرف کند. با پیشینه ای چند رشته ای در تعامل انسان و کامپیوتر، علم داده و علوم اجتماعی، تیم تحقیقاتی با سازمان های اجتماعی، دولتی و غیردولتی شریک می شوند تا فناوری های باز ایجاد کنند که پاسخ مقیاس پذیربه چنین چالش هایی.
سازمان بینالمللی مهاجرت سازمان ملل متحد (IOM) کمک مستقیم و حمایت از مهاجران در سراسر جهان و همچنین قربانیان و بازماندگان قاچاق انسان. IOM با ارائه خدمات به دولت ها و مهاجران در 175 کشور عضو، به ترویج مهاجرت انسانی و منظم اختصاص دارد. اخیراً گزارش شده 50 میلیون قربانیان کار اجباری در سراسر جهان، از جمله 3.3 میلیون کودک، 6.3 میلیون در استثمار جنسی تجاری، و 22 میلیون در دام ازدواج های اجباری. درک و رسیدگی به مشکلات در این مقیاس به فناوری کمک می کند تا به بازیگران مبارزه با قاچاق و کارشناسان حوزه کمک کند تا داده های دنیای واقعی را به شواهدی که می تواند خط مشی ها و سیستم های پشتیبانی را ایجاد کند، جمع آوری و ترجمه کنند.
بر اساس IOM، مهاجران و آوارگان برخی از آسیب پذیرترین جمعیت ها در جامعه هستند. این سازمان توضیح میدهد که «در حالی که تحرک انسان میتواند منبع رفاه، نوآوری و توسعه پایدار، هر سفر مهاجرتی میتواند شامل خطراتی برای ایمنی باشد که در زمان بحران یا زمانی که مردم تشدید میشوند face آسیب پذیری شدید زیرا مجبور می شوند در میان یک عدم وجود مسیرهای مهاجرت ایمن و منظم.
رویداد در کانون توجه: رویداد درخواستی
اجلاس تحقیقاتی مایکروسافت 2022
در صورت تقاضا اکنون تماشا کنید تا در مورد برخی از مبرمترین سؤالات پیش روی جامعه تحقیقاتی ما بیاموزید و به مکالمات با بیش از 120 محقق در مورد چگونگی اطمینان از آن گوش دهید فن آوری های جدید گسترده ترین منافع ممکن را برای بشریت دارند.
امروز، با استفاده از نرم افزار توسعه یافته توسط محققان مایکروسافت، IOM دومین مجموعه داده مصنوعی از سوابق پرونده قربانیان قاچاق، اولین مجموعه داده عمومی برای توصیف روابط قربانی و مجرم. مجموعه داده مصنوعی همچنین اولین مورد از نوع خود است که با حریم خصوصی دیفرانسیل، ارائه تضمین امنیتی اضافی برای انتشار داده های متعدد، که امکان به اشتراک گذاری داده های بیشتری را فراهم می کند و امکان انجام تحقیقات دقیق تری را در عین حفاظت از حریم خصوصی و آزادی های مدنی فراهم می کند.
انتشار دادههای جدید مبتنی بر همکاری چندین ساله مایکروسافت و IOM است تا از اشتراکگذاری ایمن دادههای سوابق پرونده قربانیان به روشهایی که میتواند به اقدامات جمعی در سراسر جامعه مبارزه با قاچاق کمک کند، پشتیبانی کند. This collaboration began in July 2019 when IOM joined the accelerator program of the هدف ایجاد شده برای همکاری و عدم استفاده از دادهها در دسترس از طریق Counter Trafficking Data Collaborative (CTDC) – اولین پورتال جهانی در داده های پرونده قاچاق انسان از آن زمان، IOM و مایکروسافت برای بهبود روشهای استفاده از دادههای قربانیان و بازماندگان شناساییشده – و همچنین حسابهای مجرمان – برای مبارزه با گسترش قاچاق انسان با یکدیگر همکاری کردهاند.
“ما از تحقیقات مایکروسافت برای همکاری ما در طول تقریباً چهار سال برای به اشتراک گذاری داده ها و در عین حال محافظت از ایمنی و حریم خصوصی قربانیان سپاسگزاریم. و بازماندگان قاچاق.”
– مونیکا گوراچی، مدیر پشتیبانی برنامه و مدیریت مهاجرت IOM
اهمیت حیاتی حریم خصوصی داده ها هنگام کار با جمعیت های آسیب پذیر
هنگام انتشار دادههای قربانیان قاچاق، همه تلاشها باید انجام شود تا اطمینان حاصل شود که قاچاقچیان به طور کامل از شناسایی قربانیان شناخته شده در مجموعه دادههای منتشر شده جلوگیری میکنند. همچنین محافظت از حریم خصوصی افراد برای جلوگیری از انگ یا سایر اشکال بالقوه آسیب یا آسیبدیدگی (دوباره) مهم است. دقت آمار داده ها نگرانی دیگری است: آمار باید به طور همزمان محققان و تحلیلگران را قادر به تضمین حریم خصوصی قربانیان و استخراج بینش مفید از مجموعه داده حاوی اطلاعات شخصی کند. این بسیار مهم است: اگر یک روش حفظ حریم خصوصی یک الگوی معین را در موارد قربانی بیش از حد یا کمتر گزارش دهد، میتواند تصمیم گیرندگان را گمراه کند تا منابع کمیاب را نادرست هدایت کنند و در نتیجه نتوانند مشکل اصلی را حل کنند.
همکاری بین IOM و مایکروسافت بر اساس این ایده شکل گرفت که به جای ویرایش دادههای حساس برای ایجاد حریم خصوصی، مجموعه دادههای مصنوعی را میتوان به روشهایی تولید کرد که ساختار و آمار مجموعه دادههای حساس زیربنایی را بهطور دقیق ثبت کند، در حالی که با طراحی خصوصی باقی میماند. اما همه دادههای مصنوعی دارای ضمانتهای رسمی برای حفظ حریم خصوصی یا دقت دادهها نیستند. بنابراین، ایجاد اعتماد در دادههای مصنوعی مستلزم این است که دادههای مصنوعی چقدر دادههای حساس واقعی را نشان میدهند، در حالی که اطمینان حاصل شود که این مقایسهها خطرات حریم خصوصی را ایجاد نمیکنند.
از این اصل بنیادی، همراه با نیاز به گزارش دقیق شمارش موارد تفکیک شده با ترکیبات مختلف ویژگی ها (مانند محدوده سنی، جنسیت، ملیت)، راه حلی پدید آمد: انتشار داده های مصنوعی در کنار > تعداد موارد حفظ حریم خصوصی، مطابق با تمام ترکیبات کوتاه ویژگی های پرونده. بنابراین، دادههای انبوه از ارزیابی کیفیت دادههای مصنوعی و بازیابی شمارش دقیق برای گزارشهای رسمی پشتیبانی میکنند. از طریق این همکاری و ماهیت مکمل دادههای مصنوعی و دادههای انبوه – همراه با رابطهای تعاملی برای مشاهده و کاوش هر دو مجموعه داده – منبع باز Synthetic Data Showcase توسعه داده شد.
در سپتامبر 2021، IOM از Synthetic Data Showcase برای انتشار اولین مجموعه داده های مصنوعی جهانی، نشان دهنده داده های بیش از 156000 قربانی و بازماندگان قاچاق در 189 کشور و قلمرو (جایی که قربانیان برای اولین بار توسط شرکای CTDC شناسایی و پشتیبانی شدند). مجموعه داده مصنوعی جهانی قربانی- مجرم، امروز منتشر شد، دومین مجموعه داده مصنوعی CTDC است که با استفاده از نسخه به روز شده Synthetic Data Showcase با پشتیبانی اضافی از حریم خصوصی متفاوت تولید شده است. این مجموعه داده جدید شامل دادههای IOM از بیش از 17000 پرونده قربانیان قاچاق و حسابهای بیش از 37000 مجرمی است که روند قاچاق را از سال 2005 تا 2022 تسهیل کردهاند. این مجموعه دادهها با هم، اطلاعات دست اولی حیاتی در مورد مشخصات اجتماعی و جمعیتی قربانیان ارائه میدهند. گزارشهای مجرمان، انواع بهرهکشی، و فرآیند کلی قاچاق – که همگی برای کمک بهتر به بازماندگان و محاکمه مجرمان حیاتی هستند.
“حریم خصوصی داده ها برای پیگیری مبارزه با قاچاق کارآمد و هدفمند بسیار مهم است سیاست ها و حکمرانی خوب مهاجرت.”
– ایرینا تودورووا، رئیس واحد کمک به مهاجران آسیب پذیر در بخش حفاظت IOM
یک مجموعه داده خصوصی متفاوت
در سال 2006، محققان مایکروسافت توسعه اولیه حریم خصوصی متفاوت را رهبری کردند، و امروزه این استاندارد طلایی در حفاظت از حریم خصوصی است. این کمک میکند تا اطمینان حاصل شود که پاسخهای پرسشهای داده مشابه هستند، خواه هر موضوع دادهای در مجموعه داده وجود داشته باشد یا نباشد، و بنابراین نمیتوان از آن برای استنباط حضور افراد خاص، چه به طور مستقیم یا غیر مستقیم استفاده کرد.
الگوریتمهای موجود برای ترکیب دادههای خصوصی متفاوت معمولاً با «پنهان کردن» ترکیبهای واقعی از ویژگیها در دریایی از ترکیبهای ویژگیهای ساختگی یا جعلی که بهطور خاص آنچه را در مجموعه دادههای حساس اصلی بود، حفظ نمیکنند.
اگر وجود این ترکیبهای ویژگیهای ساختگی وضعیت دنیای واقعی را نادرست معرفی کند و تصمیمگیری، سیاستگذاری یا تخصیص منابع پاییندستی را به ضرر جمعیت زیربنایی منحرف کند، میتواند مشکلساز باشد (به عنوان مثال، تشویق پلیس در مسیرهای قاچاق عملاً مشاهده نشده است).
هنگامی که تیم تحقیقاتی با این چالشها با سینت سایزرهای خصوصی متفاوت مواجه شدند، محققان همکار مایکروسافت را برای کشف راهحلهای احتمالی درگیر کردند. آنها اهمیت حیاتی گزارش شمارش دقیق ترکیبهای ویژگیهای واقعی در حمایت از گزارشهای آماری و مداخله مبتنی بر شواهد را توضیح دادند و اینکه چگونه «ویژگی» ساخت ترکیبهای مشاهده نشده به عنوان راهی برای حفظ حریم خصوصی میتواند هنگام تلاش برای درک دنیای واقعی مضر باشد. الگوهای استثمار.
آن همکاران اخیراً مشکل مشابهی را در زمینه متفاوتی حل کرده بودند: نحوه استخراج تعداد دقیق ترکیبهای کلمه n گرم از مجموعه دادههای متن خصوصی. راهحل آنها، که اخیراً در کنفرانس 2021 در مورد سیستم های پردازش اطلاعات عصبی، به طور قابل توجهی از وضعیت هنر پیشی گرفت. آنها با همکاری تیم تحقیقاتی که با IOM کار می کنند، این راه حل را با رویکردی جدید برای ایجاد حاشیههای خصوصی متفاوت—شمارش همه ترکیبهای کوتاه ویژگیهایی که یک مجموعه داده مجموع خصوصی متفاوت را نشان میدهند.
از آنجایی که دادههای خصوصی متفاوت این ویژگی را دارند که پردازش بعدی نمیتواند از دست دادن حریم خصوصی را افزایش دهد، هر مجموعه داده تولید شده از چنین مجموعههایی همان سطح حریم خصوصی را حفظ میکند. این تیم را قادر میسازد تا اصلاح کند رویکرد موجود آنها به سنتز داده ها – ایجاد رکوردهای مصنوعی با نمونه برداری از ترکیبات ویژگی ها تا زمانی که همه ویژگی ها در نظر گرفته شوند – برای برون یابی این ترکیبات ویژگی های گزارش شده پر سر و صدا در رکوردهای مصنوعی کامل و خصوصی متفاوت. نتیجه دقیقاً همان چیزی است که IOM و سازمانهای مشابه برای ایجاد یک اکوسیستم دادهای پررونق در مبارزه با قاچاق انسان و سایر موارد نقض حقوق بشر به آن نیاز دارند: دادههای کل دقیق برای گزارشهای رسمی، دادههای ترکیبی برای کاوش تعاملی و یادگیری ماشینی، و تضمینهای متفاوت حریم خصوصی که ارائه میکنند. محافظت حتی در برابر انتشار داده های متعدد با هم تداخل دارند.
این سینتی سایزر جدید اکنون در دسترس است انجمن از طریق کتابخانه SmartNoise مایکروسافت در ابتکار OpenDP. برخلاف سینت سایزرهای موجود، کنترل قوی بر میزان مجاز ساختن ترکیبات ویژگی های جعلی فراهم می کند و مجموعه داده های مصنوعی را با داده های انبوه «واقعی» که توسط حریم خصوصی متفاوت محافظت می شود، تقویت می کند.
دسترسی به الگوهای خصوصی و در عین حال دقیق از ویژگیهایی که روابط قربانی و مجرم را مشخص میکنند، به ذینفعان اجازه میدهد تا درک عوامل خطر آسیبپذیری را پیش ببرند و مداخلات مؤثر ضد قاچاق را انجام دهند، همگی در عین حال که هویت قربانیان را خصوصی نگه میدارند.
>
«مجموعه دادههای جدید اولین مجموعه جهانی از دادههای موردی را نشان میدهد که نمایههای قربانیان و مجرمان قاچاق را به هم مرتبط میکند که تا کنون در دسترس عموم قرار گرفته است، در حالی که تضمینهای قوی حفظ حریم خصوصی را ممکن میسازد. این اطلاعات حیاتی را برای کمک بهتر به بازماندگان و محاکمه مجرمان ارائه می دهد. – کلر گالز-دیویس، دانشمند داده در بخش حفاظت IOM.
یک رابط بصری جدید و برنامه وب ابزار عمومی
حل مشکلات در مقیاس جهانی به ابزارهایی نیاز دارد که اشتراکگذاری ایمن دادهها را در هر کجا که نیاز باشد و به روشی قابل درک برای همه ذینفعان قابل دسترسی باشد. این تیم می خواست یک رابط بصری برای کمک به ایجاد یک پایگاه شواهد مشترک و ایجاد انگیزه برای اقدام جمعی توسط جامعه ضد قاچاق ایجاد کند. آنها همچنین می خواستند اطمینان حاصل کنند که این راه حل برای هر کسی که نیاز به اشتراک گذاری داده های حساس به صورت ایمن و مسئولانه دارد، در دسترس است. رابط کاربری جدید توسعه یافته از طریق این کار اکنون به عنوان وب ابزار عمومی در دسترس است برنامه که در آن جمع آوری و ترکیب داده های خصوصی به صورت محلی در مرورگر وب انجام می شود، بدون اینکه هیچ داده ای از دستگاه کاربر خارج شود.
“من برنامه وب اجرا شده محلی را فوق العاده تعاملی و شهودی می دانم. توضیح فرآیند تولید داده و آموزش استفاده از رابط وب جدید برای من بسیار آسان تر است. از آنجایی که دادهها به صورت محلی در رایانههای ما پردازش میشوند، لازم نیست نگران نشت دادهها باشم.» – لورین وانگ، افسر تحقیقاتی در بخش حفاظت IOM.
چه چیزی در آینده برای همکاری IOM و مایکروسافت
مایکروسافت و IOM راه حل را برای سایر سازمان ها، از جمله سازمان های دولتی مرکزی، در دسترس عموم قرار داده اند. این می تواند توسط هر ذینفعی که می خواهد داده های حساس را جمع آوری و منتشر کند و در عین حال از حریم خصوصی افراد محافظت کند، استفاده شود.
سازمانها قصد دارند از طریق کارگاههای آموزشی و راهنمایی در مورد نحوه تولید دادههای اداری با کیفیت بالا، شواهدی را در مورد بهرهبرداری و سوء استفاده برای حمایت از کشورهای عضو، سایر آژانسهای سازمان ملل، و سازمانهای مبارزه با قاچاق در سراسر جهان به اشتراک بگذارند. این نوع دادههای اداری منبع کلیدی اطلاعاتی است که آمارهای پایه را ارائه میکند که میتواند برای درک الگوها، عوامل خطر، روندها و شیوههای عملیاتی که برای فرمول بندی پاسخ خط مشی.
به عنوان مثال، IOM با دفتر سازمان ملل متحد در مورد مواد مخدر و جرم (UNODC) برای ایجاد استانداردها و راهنمایی های بین المللی برای حمایت از دولت ها در تولید داده های اداری با کیفیت بالا همکاری می کند. همچنین با سازمان بینالمللی کار سازمان ملل متحد (ILO) برای فهرستبندی تحقیقات سیاستمحور در مورد قاچاق در یک هدف کتابشناسی. در نهایت، IOM یک دوره آنلاین، شامل یک ماژول که شامل راهنمایی در مورد داده های مصنوعی است، برای تشویق به اشتراک گذاری ایمن داده ها از سوی دولت ها و سازمان های خط مقدم مبارزه با قاچاق، تولید می کند.
فینیاس جاسی، کارشناس مدیریت داده و پژوهش در بخش حفاظت IOM توضیح داد: «توانایی انتشار دادههای بیشتر از گذشته و حتی به روشی ایمنتر، یک دستاورد بزرگ است. وی افزود: «هدف این است که این دادهها به شواهدی مبنی بر قاچاق انسان کمک کند، که به نوبه خود به طراحی سیاستهای کارآمد و هدفمند مبارزه با قاچاق انسان و دستیابی به حکومت مهاجرت خوب کمک میکند.»
ترجمه دادهها به شواهد، هدف برنامه مربوط به ShowWhy از همان تیم تحقیقاتی مایکروسافت، که کارشناسان حوزه را از طریق فرآیند پایان به انتها توسعه شواهد علی از داده های مشاهده ای راهنمایی می کند. درست مانند Synthetic Data Showcase، قابلیت های پیشرفته علم داده را در دسترس قرار می دهد. به متخصصان حوزه از طریق مجموعه ای از رابط های کاربری تعاملی و بدون کد.
دارن اج، مدیر تحقیقات مایکروسافت، گفت: «راهاندازی یک واکنش جهانی هماهنگ علیه قاچاق انسان مستلزم حذف موانع سنتی برای دسترسی به دادهها و تجزیه و تحلیل دادهها است». با برنامههای Synthetic Data Showcase و ShowWhy، ما قصد داریم به متخصصان دامنه قدرت دهیم تا شواهد علی را برای خود، از دادههای حساسی که نمیتوانستند به اشتراک بگذارند، ایجاد کنند، و از آن برای اطلاعرسانی به اقدامات جمعی با دقت و مقیاسی که نمیتوانست استفاده کنیم. در غیر این صورت تصور نمی شود.»