مدل داوطلب برای پورتالهای داده باز
در پست قبلی، نگاهی انداختیم به پورتال داده باز کنیا، طرحی دولتی با نیت درست که به چندین مشکل برخورد. از آنجایی که این طرح دولتی است، بودجهاش از طرف وزارت اطلاعات و ارتباطات و فناوری کنیا تامین میشود.
در این مدل، تیمی از متخصصین فناوری و علم داده استخدام میشوند تا کارکرد پورتال داده باز را از طریق پژوهش، استخراج داده و بارگذاری آن در سیاسوی (CSV) و فورمتهای دیگری که کامپیوتر قابلیت خوانش آنها را دارد، حفظ کنند.
این یک شرایط ایدهآل است، اما به احتمال زیاد باعث میشود تا میزان دادههای بارگذاری شده به علایق و ظرفیت این تیم محدود شود.
اما الگوها و روشهای بسیار دیگری برای ساخت پورتال داده وجود دارند. برای مثال، اگر بتوانید کار را به گروههای علاقمند دیگر واگذار کنید چه پیامدهایی دارد؟ این به این معنا خواهد بود که بازه متنوعتری از مجموعه داده بدست خواهد آمد و مجموعه دادههای بسیار بیشتری به صورت کلی، برای استفاده عموم، بر روی وبسایت بارگذاری خواهند شد.
انبوهسپاری (Crowdsourcing) به شکل امروزیاش، پدیده نوظهوریست که با اتصالی از طریق اینترنت فراهم شده و آن را ممکن ساخته است. وقتی به انبوهسپاری به عنوان یک روش فکر کنیم، ممکن است متوجه شویم ایده پروژههایی را از قبل داریم که از طریق الگوی انبوهسپاری امکان به نتیجه رسیدن آنها وجود داشته باشد. این الگو برای همه چیز، از سیستم اجاره دادن Airbnb گرفته تا حل کردن معماها در Reddi، قابل استفاده است.
داده باز هم میتواند از این الگو بسیار بهره ببرد، به خصوص در نبود بودجه کافی برای استخدام تیمی از متخصصینی که زمان خود را وقف فعال نگه داشتن پورتال داده باز کنند.
برای اجرای این الگو، نرمافزارهای مختلفی وجود دارند که روند پروژههای مستقل داده باز را آسان میکنند.
برای مثال CKAN (شبکه جامع آرشیو دانش)، یک نرمافزار منبع باز برای درست کردن پورتالهای داده باز است. این نرمافزار شبیه سامانه مدیریت محتوا مثل WordPress است اما برای داده. کد منبع این شبکه توسط بنیاد دانش باز نگهداری میشود و به یک کاتالوگ قدرتمند داده تبدیل شده که بیشتر توسط موسسات غیر خصوصی استفاده میشود که به دنبال به اشتراک گذاشتن دادههای خود با مردم هستند، برای مثال، وبسایتهای داده دولت انگلستان (data.gov.uk) و ایالات متحده آمریکا (data.gov).
تصویری از صفحه CKAN
این انرمافزار کمکی است برای ذخیرهسازی و توزیع داده و همچنین میتواند دستگاه پرتوانی برای یک پورتال داده باز داوطلب-محور باشد.
همچنین، زمانی که میخواهید ساختار پورتال داده باز خود را شکل دهید، سازمانهایی چون بنیاد دانش باز، Open Heroines و govLab منابع بسیاری چون دستورالعملها، تجربهها و الگوهای سرآمد را برای شما فراهم میکنند.
بیایید نگاهی بیندازیم به فواید و مضرات این مدل.
نقاط قوت
عاملین مختلفی همچون سازمانهای مردمنهاد که دادههای خود را خود تولید میکنند، روزنامهنگاران، پژوهشگران، علاقهمندان به علم داده و گروههای دیگر میتوانند زیرساختی را خلق کنند که پورتال براساس آن به کار خود ادامه دهد. این گروهها به واسطه مشارکت در پورتال میتوانند منابع خود را با فرمتی که قابلیت خوانش توسط کامپیوتر را دارد، به اشتراک بگذارند و دیگران را از این منابع بهرهمند کنند. در عوض، آنها هم به ذخایر رو به رشدی از اطلاعات ارزشمند در زمینههای بسیار متنوعی دسترسی خواهند داشت.
علاوه براین، استفاده از این الگو موجب میشود که به تعداد کمتری از کارمندان ثابت نیاز باشد. تنها به یک نفر برای رسیدگی به وبسایت و فعالیتهای مدیریتی جزئی نیاز خواهد بود که این موضوع موجب پایداری پروژه و حفظ قابلیت open source (نرم افزار منبع باز) بودن و همچنین کم هزینه بودن آن میگردد.
با استفاده از این الگو افرادی که به بارگذاری داده میپردازند، از دامنه وسیعی از کشورها، سوابق، نژادها، مذاهب و جنسیتهای مختلف خواهند بود که همین امر موجب اغنای دادههای به اشتراک گذاشته شده میشود.
مزیت دیگری که کار با این سیستم به همراه دارد، تمرکززدایی از اطلاعات است. در دنیای امروز که مردم بیش از پیش آگاهند که چطور روایات میتوانند بدست عوامل مختلف و مقاصد گوناگون کنترل و تحریف شوند، این واقعیت که یک عامل واحد نمیتواند داده بارگذاری شده را کنترل کند، موجب اعتبار پروژه می شود. این موضوع، باعث میشود که عموم مردم به همکاری با وبسایت ترغیب شوند.
در یک طرح انبوهسپاری که نیاز به سهیم شدن جامعه دارد، ساختن چنین پورتالی، به وجود آمدن دستهای از مردم است که با این پلتفرم تعامل میکنند، به خصوص اگر پلتفرمهای تعاملی روی وبسایت و یا صفحات رسانههای اجتماعی گنجانده شوند.
مهمتر از همه این است که این الگو تقریباً تضمین میکند که انتشار داده، احتمالا هدفمند خواهد بود. منشور داده باز اینطور بیان میکند: "ما در تلاش خود برای ترغیب دولتها به سمتی که داده باز به صورت پیشفرض اتفاق بیفتد، به این نتیجه رسیدهایم که وقتی داده به قصد حل مشکل معینی در سیاستها منتشر میشود، موثرتر عمل میکند. انتشار هدفمند داده، انگیزه و شتاب بیشتری نسبت به اینکه داده بدون هدف خاصی منتشر شود، خلق میکند."
استفاده کردن از داده خوب است. اما آنچه که داده را بهتر میکند استفاده از آن برای انجام اهداف بزرگتر است.
نقاط ضعف
یک مسئلهای که با ورود به چنین کاری باید درنظر گرفت، میتوان از خطر بیثباتی در نظم و ترتیب انتشار داده نام برد، چرا که تماماً وابسته به کاربران است. اگر زمانی برسد که میزان داده بارگذاری شده فروکش کند، کار چندانی نمیتوان انجام داد. این مشکل را میتوان با ایجاد گروهی از افراد علاقمند مهار کرد، افرادی که مایل هستند تا به صورت دائمی اطلاعات را بارگذاری کنند. برای این منظور باید حضوری آنلاین در شبکههای اجتماعی و پلتفرمهای دیگری که علاقمندان داده در آنها فعال هستند، داشت. راه دیگر مقابله با این مشکل میتواند ترغیب سازمانهایی باشد که مرتبا در حال تولید داده هستند، تا از پورتال شما به عنوان شبکهای برای ذخیره و توزیع دادههای خود استفاده کنند.
نکته قابل بحث دیگر به خصوص در مراحل اولیه کار، کیفیت دادههایی است که بارگذاری میشوند. این معضل را میتوان از این طریق حل کرد که یک خط مشی دقیق، به شکلی شفاف بر روی وبسایت پورتال تعیین شود و مطالبی که بارگذاری می شوند به طور مداوم بررسی شوند. از این رو، حذف مرتب اسپم کار پرزحمتی خواهد بود.
این سیستم، منوط به اینکه چه منابعی در دسترس هستند و میتواند به شکلهای مختلفی وجود داشته باشد. اینطور که ممکن است نیمی از کار توسط داوطلبان و نیم دیگر توسط کارکنان استخدامی انجام میشود. حتی میتواند از این الگو به الگویی دیگر تغییر کند، اما برای شروع، سکوی پرتاب خوبی است.