ما که هستیم؟
پایگاه داده باز ایران ابتکار مشترک افراد و سازمانهایی است که به موضوع داده باز و شفافیت علاقهمندند. پایگاه داده باز ایران مشتاق گسترش دامنهی اعضای خود است، اگر به موضوع داده باز علاقهمندید، لطفا با ما تماس بگیرید.
داده باز چیست؟
به زبان ساده و همانگونه که موسسه داده باز (Open Data Institute) تعریف میکند، داده باز دادهای است که «همه بتوانند به آن دسترسی داشته باشند، از آن استفاده کنند و به اشتراک بگذارند». به طور خاص، موسسه دانش باز بینالمللی (Open Knowledge International) کتابچه راهنمایی در مورد داده باز منتشر کرده و در آن توضیح میدهد که داده در صورتی باز به حساب میآید که از سه اصل اساسی زیر تبعیت کند:
- در دسترس باشد، با هزینهای معقول برای باز تولید آن.
- استفاده و توزیع مجدد آن امکانپذیر باشد، به این معنی که مجوز آن اجازهی استفاده و توزیع مجدد آن را بدهد.
- امکان مشارکت همگانی داشته باشد، به این معنی که استفاده، استفاده مجدد و توزیع دوباره دادهها محدودیتی نداشته باشد.
چرا پایگاه داده باز ایران؟
سازمانهای دولتی در ایران در همه سطوح -شهری، استانی و ملی- دادههای عمومی فراوانی منتشر میکنند. اما در بسیاری از مواقع این دادهها به راحتی قابل دسترسی نیستند: یا در فرمتهای غیرقابل دسترس مانند پیدیاف یا عکس عرضه شدهاند، یا در پس لایههای مختلف وبسایتهای رسمی آمدهاند یا اصلا در قالب دیجیتال عرضه نشدهاند.
پایگاه داده باز ایران قصد دارد دادههای دولتی ایران را در یک جا جمع کرده و آنها را در قالبهایی که با ماشین قابل خواندن باشند (مانند CSV یا JSON) در یک کانون مرکزی ارائه دهد. هدف ما این است که به پایگاه آنلاین معتبر داده برای محققان، خبرنگاران و شهروندان ایرانی تبدیل شویم؛ و معتقدیم وجود چنین پایگاهی به افراد کمک میکند تا عملکرد و سیاستهای دولت خود را بهتر درک کنند.
باز و رایگان بودن داده یکی از ویژگیهای کلیدی دولت پاسخگو و مسئول است. در این مسیر، پایگاه داده باز ایران امیدوار است بتواند حوزههایی را که مسئولان ایرانی میتوانند شفافیت فعالیتهای خود را بالا ببرند، برجسته کند. این کار با در اختیار عموم گذاشتن داده و دسترسی راحت به دادهها ممکن است.
روش کار ما چیست؟
یک پایگاه داده باز، خود نیز باید باز باشد. یکی از ویژگیهای برجسته پایگاه داده باز ایران این است که کل فرآیند تکنولوژی و معماری پلتفرم آن بر روی CKAN که یکی از پلتفرمهای پیشرو در منابع داده باز است به صورت عمومی قابل دسترس است. کدهای سایت در اینجا در دسترس است، مشخصات دادهها و همه اطلاعات در مورد مجموعه دادههای موجود را نیز اینجا میتوان دید.
روش جمعآوری و تمیز کردن داده (که به آن اصطلاحا تمیزکاری داده یا data ingest میگوییم) به ماهیت مجموعه داده بستگی دارد. در برخی موارد ممکن است که اسکریپت خودکار (Automated Script) طراحی کنیم تا کار را برای ما انجام دهد. کد همه اسکریپتهایی که طراحی میکنیم اینجا در دسترس خواهند بود.
برای به دست آوردن دادههایی که در فرمتهای ناخوانا و پیچیده حبس شدهاند نیز از ابزارهای مختلف استفاده میکنیم. به عنوان مثال، برای دادههایی که به صورت پیدیاف عرضه شدهاند در حال حاضر از Tabula استفاده میکنیم که نیازمند فرآیندی دستی است.
به دلیل این فرآیند دستی، امکان وجود تناقضات در این مجموعه دادهها وجود دارد. اگر با این خطاها برخورد کردید، لطفا با ما تماس بگیرید. و در نظر داشته باشید که تلاش برای تحقیق بیشتر در جهت یافتن اطلاعات تکمیلی برای تصدیق یافتههای بر مبنای این مجموعه دادهها بر عهده خود کاربر وبسایت است. برای اطلاعات بیشتر لطفا صفحه مقررات را ببینید.