مدل داوطلب برای پورتال‌های داده باز

05 اردیبهشت 1399 / 24 آوریل 2020

در پست قبلی، نگاهی انداختیم به پورتال داده باز کنیا، طرحی دولتی با نیت درست که به چندین مشکل برخورد. از آنجایی که این طرح دولتی است، بودجه‌اش از طرف وزارت اطلاعات و ارتباطات و فناوری کنیا تامین می‌شود.

در این مدل، تیمی از متخصصین فناوری و علم داده استخدام می‌شوند تا کارکرد پورتال داده باز را از طریق پژوهش، استخراج داده و بارگذاری آن در سی‌اس‌وی (CSV) و فورمت‌های دیگری که کامپیوتر قابلیت خوانش آن‌ها را دارد، حفظ کنند. 

این یک شرایط ایده‌آل است، اما به احتمال زیاد باعث می‌شود تا میزان داده‌های بارگذاری شده به علایق و ظرفیت این تیم محدود شود.

اما الگوها و‌ روش‌های بسیار دیگری برای ساخت پورتال داده وجود دارند. برای مثال، اگر بتوانید کار را به گروه‌های علاقمند دیگر واگذار کنید چه پیامدهایی دارد؟ این به این معنا خواهد بود که بازه‌ متنوع‌تری از مجموعه داده بدست خواهد آمد و مجموعه داده‌های بسیار بیشتری به صورت کلی، برای استفاده عموم، بر روی وب‌سایت بارگذاری خواهند شد.

انبوه‌سپاری (Crowdsourcing) به شکل امروزی‌اش، پدیده‌ نوظهوریست که با اتصالی از طریق اینترنت فراهم شده و آن را ممکن ساخته است. وقتی به انبوه‌سپاری به عنوان یک روش فکر کنیم، ممکن است متوجه شویم ایده‌‌ پروژه‌هایی را از قبل داریم که از طریق الگوی انبوه‌سپاری امکان به نتیجه رسیدن آن‌ها وجود داشته باشد. این الگو برای همه چیز، از سیستم اجاره‌ دادن Airbnb گرفته تا حل کردن معماها در Reddi، قابل استفاده است.

داده باز هم می‌تواند از این الگو بسیار بهره ببرد، به خصوص در نبود بودجه کافی برای استخدام تیمی از متخصصینی که زمان خود را وقف فعال نگه داشتن پورتال داده باز کنند.

برای اجرای  این الگو، نرم‌افزارهای مختلفی وجود دارند که روند پروژه‌های مستقل داده باز را آسان می‌کنند.

برای مثال CKAN (شبکه جامع آرشیو دانش)، یک نرم‌افزار منبع  باز برای درست کردن پورتال‌های داده باز است. این نرم‌افزار شبیه سامانه مدیریت محتوا مثل WordPress است اما برای داده. کد منبع این شبکه توسط بنیاد دانش باز نگهداری می‌شود و به یک کاتالوگ قدرتمند داده تبدیل شده که بیشتر توسط موسسات غیر خصوصی استفاده می‌شود که به دنبال به اشتراک گذاشتن داده‌های خود با مردم هستند، برای مثال، وبسایت‌های داده دولت انگلستان (data.gov.uk) و ایالات متحده آمریکا (data.gov). 

تصویری از صفحه CKAN

این انرم‌افزار کمکی است برای ذخیره‌سازی و توزیع داده و همچنین می‌تواند دستگاه پرتوانی برای یک پورتال داده باز داوطلب-محور باشد.

همچنین، زمانی که می‌خواهید ساختار پورتال داده باز خود را شکل دهید، سازمان‌هایی چون بنیاد دانش باز، Open Heroines و govLab منابع بسیاری چون دستورالعمل‌ها، تجربه‌ها و الگوهای سرآمد را برای شما فراهم می‌کنند. 

بیایید نگاهی بیندازیم به فواید و مضرات این مدل.

 

نقاط قوت

عاملین مختلفی همچون سازمان‌های مردم‌نهاد که داده‌های خود را خود تولید می‌کنند، روزنامه‌نگاران، پژوهشگران، علاقه‌مندان به علم داده و گروه‌های دیگر می‌توانند زیرساختی را خلق کنند که پورتال براساس آن به کار خود ادامه دهد. این گروه‌ها به واسطه‌ مشارکت در پورتال می‌توانند منابع خود را با فرمتی که قابلیت خوانش توسط کامپیوتر را دارد، به اشتراک بگذارند و دیگران را از این منابع بهره‌مند کنند. در عوض، آن‌ها هم به ذخایر رو به رشدی از اطلاعات ارزشمند در زمینه‌های بسیار متنوعی دسترسی خواهند داشت‌. 

علاوه براین، استفاده از این الگو موجب می‌شود که به تعداد کمتری از کارمندان ثابت نیاز باشد. تنها به یک نفر برای رسیدگی به وبسایت و فعالیت‌های مدیریتی جزئی نیاز خواهد بود که این موضوع موجب پایداری پروژه‌ و حفظ قابلیت open source (نرم افزار منبع باز) بودن و همچنین کم هزینه بودن آن می‌گردد.

با استفاده از این  الگو افرادی که به بارگذاری داده می‌پردازند، از دامنه‌ وسیعی از کشورها، سوابق، نژادها، مذاهب و جنسیت‌های مختلف خواهند بود که همین امر موجب اغنای  داده‌های به اشتراک گذاشته شده می‌شود. 

مزیت دیگری که کار با این سیستم به همراه دارد، تمرکززدایی از اطلاعات است. در دنیای امروز که مردم بیش از پیش آگاهند که چطور روایات می‌توانند بدست عوامل مختلف و مقاصد گوناگون کنترل و تحریف شوند، این واقعیت که یک عامل واحد نمی‌تواند داده‌ بارگذاری شده را کنترل کند، موجب اعتبار پروژه می شود. این موضوع، باعث می‌شود که عموم مردم به همکاری با وبسایت ترغیب شوند. 

در یک طرح انبوه‌سپاری که نیاز به سهیم شدن جامعه دارد، ساختن چنین پورتالی، به وجود آمدن دسته‌ای از مردم است که با این پلتفرم تعامل می‌کنند، به خصوص اگر پلتفرم‌های تعاملی روی وبسایت و یا صفحات رسانه‌های اجتماعی گنجانده شوند. 

مهمتر از همه این است که این الگو تقریباً تضمین می‌کند که انتشار داده، احتمالا هدفمند خواهد بود. منشور داده باز اینطور بیان می‌کند: "ما در تلاش خود برای ترغیب دولت‌ها به سمتی که  داده باز به صورت پیش‌فرض اتفاق بیفتد، به این نتیجه رسیده‌ایم که وقتی داده به قصد حل مشکل معینی در سیاست‌‌ها منتشر می‌شود، موثرتر عمل می‌کند. انتشار هدفمند داده، انگیزه و شتاب بیشتری نسبت به اینکه داده بدون هدف خاصی منتشر شود، خلق می‌کند."

استفاده کردن از داده خوب است. اما آنچه که داده را بهتر می‌کند استفاده از آن برای انجام اهداف بزرگتر است.

 

نقاط ضعف

یک مسئله‌ای که با ورود به چنین کاری باید درنظر گرفت، می‌توان از خطر بی‌ثباتی در نظم و ترتیب انتشار داده نام برد، چرا که تماماً وابسته به کاربران است. اگر زمانی برسد که میزان داده‌ بارگذاری شده فروکش کند، کار چندانی نمی‌توان انجام داد. این مشکل را می‌توان با ایجاد  گروهی از افراد علاقمند مهار‌ کرد، افرادی که مایل هستند تا به صورت دائمی اطلاعات را بارگذاری کنند. برای این منظور باید حضوری آنلاین در شبکه‌های اجتماعی و پلت‌فرم‌های دیگری که علاقمندان داده در آن‌ها فعال هستند، داشت. راه دیگر مقابله با این مشکل می‌تواند ترغیب سازمان‌هایی باشد که مرتبا در حال تولید داده هستند، تا از پورتال شما به عنوان شبکه‌ای برای ذخیره و توزیع داده‌های خود استفاده کنند.

نکته‌ قابل بحث دیگر به خصوص در مراحل اولیه کار، کیفیت داده‌هایی است که بارگذاری می‌شوند. این معضل را می‌توان از این طریق حل کرد که یک خط مشی دقیق، به شکلی شفاف بر روی وبسایت پورتال تعیین شود و مطالبی که بارگذاری می شوند به طور مداوم بررسی شوند. از این  رو، حذف مرتب اسپم کار پرزحمتی خواهد بود. 

این سیستم، منوط به اینکه چه منابعی در دسترس هستند و می‌تواند به شکل‌های مختلفی وجود داشته باشد. این‌طور که ممکن است نیمی از کار توسط داوطلبان و نیم دیگر توسط کارکنان استخدامی انجام می‌شود. حتی می‌تواند از این الگو به الگویی دیگر تغییر کند، اما برای شروع،‌ سکوی پرتاب خوبی است.