کپچافا: برای خلق لذت پارسی دیجیتال

نوشته شده توسط علیرضا مجیدی در تاریخ ۱۴ مرداد

هنگام کامنت‌ گذاشتن در سایت‌ها و وبلاگ‌ها یا ورود به سایت‌های مختلف داخلی یا خارجی، شما حتما به کپچا CAPTCHA برخورده‌اید. «کپچا»‌ها همان عبارات متنی‌ای هستند که برنامه‌های کامپیوتری قادر به تشخیص آنها نیستند و فقط یک کاربر انسان می‌تواند، عین عبارات را وارد کند، این ترتیب سایت از گزند حمله‌های خرابکارانه ربات‌های اینترنتی در امان می‌ماند.

علیرغم هدف اصلی کپچاها که استفاده از آنها را توسط صاحبان سایت‌ها ناگزیر می‌کند، خیلی از کاربران از کپچاها بیزار هستند، تصور کنید که می‌خواهید وارد حساب بانکی خود شوید یا یک کامنت بگذارید و بعد مجبور باشید، تعداد زیادی کاراکتر را با دقت وارد کنید. گاهی هم این کپچاها آنقدر محو و ناخوانا هستند که کاربر با وجود تمرکز نسبی، آنها را غلط وارد می‌کند و ناخشنود می‌شود، چیز آزاردهنده این است که مجبور هستیم، همه عبارات را به لاتین وارد کنیم.

اما امروز خبر خوبی شنیدم: کپچافا  راه افتاده است، سیستمی که به کلی این روند را تغییر خواهد داد، با استفاده از کپچافا صاحبان سایت‌های می‌توانند از عبارات پارسی به جای عبارات لاتین استفاده کنند، به این ترتیب کاربران بسیار راحت‌تر هستند.

یک مزیت عمده کپچافا، نسبت به کپچاهای روتین، این است که از لغات بی‌معنی در آن استفاده نمی‌شود. سایه تهدید ربات‌های هوشمند مجهز به دیکشنری همیشه کپچاها را تهدید می‌کند، طوری که راه چاره‌ای جز گنجاندن عبارات بی‌معنی در کپچاها باقی نمی‌ماند، اما در مورد کپچافا خوشبختانه فعلا چنین تهدید امنیتی وجود ندارد.

مزیت دیگر استفاده از کپچافا، واضح است، ما پارسی‌زبان هستیم، پس چرا از عبارات پارسی استفاده نکنیم؟

با رفتن به اینجا می‌توانید با شیوه نصب کپچافا آشنا شوید.

کپچافا ظاهرا با همکاری دانشکده فنی تهران و انستیتو تکنولوژی ایلینویز شکل گرفته است.

در پایان دو پیشنهاد برای تیم فنی کپچافا داریم:

۱- ترتیبی داده شود که کسانی که مهارت فنی کمتری دارند با استفاده از پلاگین‌هایی مثلا برای وردپرس و دیگر سیستم‌های انتشا رمحتوا، راحت‌تر بتوانند کپچافا را نصب کنند.

۲- اما پیشنهاد دوم من شاید در صورت عملی شدن بتواند تحولی در زمینه دیجیتال کردن فرهنگ ایرانی ایجاد کند:

طبق آماری که لوییس وون‌‌آن -یکی از ایجادکننده‌های سیستم کپچا- ارائه داده است، روزانه ۲۰۰ میلیون کپچا توسط مردم دنیا تایپ می‌شود و به طور متوسط برای تایپ هر کپچا ۱۰ ثانیه زمان استفاده می‌شود، حالا محاسبه کنید، زمان کل را! پس چرا از این انرژی به شیوه مطلوبی استفاده نکنیم؟!

شاید بدانید که یکی از کاربردهای جانبی کپچاها، دیجیتال کردن متون ناخوانای انگلیسی است، بعضی از کلمات موجود در کتاب‌ها از سوی OCRها ناخوانا تشخیص داده می‌شوند، می‌توان این کلمات را به عنوان کپچا به کاربران داد تا آنها کلمات را شناسایی و به طور صحیح وارد کنند. برای حصول اطمینان از اینکه جواب وارد شده صحیح است و فرد کلمه را اشتباه تشخیص نداده، دو کلمه به کاربر داده می شود، یکی از کلمات، کلمه کلیدی است که سیستم آن را می‌داند و دیگری کلمه ی مبهم مورد نظر است. اگر کاربر کلمه کلیدی را درست وارد کند، به احتمال زیاد کلمه نامعلوم دیگر را هم صحیح وارد کرده است.

می‌توان همین کار را در زمینه کپچافا هم انجام داد. انبوهی از اسناد، کتاب‌ها، مجله‌ها و متون ارزشمندی که به زبان فارسی هستند، هنوز دیجیتال نشده‌اند، و در شرایطی که OCRهای فارسی هم هنوز دقت بالایی ندارند، این کار بسیار ارزشمند خواهد بود.

مدت‌هاست که سایت گنجور به صورت هوشمندانه‌ای متون ادبی زیادی را به فرمت متنی تبدیل می‌کند. حمیدرضا محمدی، پایه‌گذار این سایت ترتیبی داده که کتاب‌ها نخست اسکن شوند، OCRها یک متنی‌سازی اولیه روی آنها انجام بدهند، بعد کاربران داوطلب، این متن‌ها را بازبینی و ویرایش کنند. (قسمت بازبینی OCR گنجور را ببینید.)

حالا با پیوند دادن سیستم گنجور (یا یک سیستم با کاربرد مشابه) با کپچافا می‌شود، از نیروی ده‌ها هزار کاربر اینترنتی استفاده کرد و دیجیتال کردن کتاب‌ها را سرعت بیشتری داد.

البته در گام اول باید استفاده از کپچافا همه‌گیر شود، تا بتوان به عملی شدن این آرزو، امید بست.

شاید تا همین چند وقت دیگر، ماها هنگام کامنت گذاشتن یا وارد شدن به حساب‌های کاربری خود، دیگر با عذاب تایپ عبارات بی‌معنی لاتین روبرو نشویم و در دل، از اینکه با هر تایپ کچافا، کلمه و عبارتی از فرهنگمان را هم دیجیتال کرده‌ایم، به خشنودی کامل برسیم.

Print FriendlyPrint Get a PDF version of this webpage PDF

پستهای مشابه

  1. راه جالبی برای پیدا کردن دوربین دیجیتال گم‌شده یا به سرقت رفته
  2. خاطرات دیجیتال ، زندگی دیجیتال ، پروژه MyLifeBits مایکروسافت
  3. آبشار دیجیتال کوکاکولا
  4. اشتراک و حاشیه‌نویسی دیجیتال صفحات وب با سایت SharedCopy
  5. عجیب‌ترین «کپچا»یی که دیدم


یک پزشک

نظرتان را در مورد مطلب فوق بنویسید. نشانی ایمیل شما منتشر نخواهد شد.