זיהוי ממוחשב של כתב יד

זיהוי כתב עוזר למחשב לקרוא כתב יד ולהפוך אותו לטקסט שניתן לערוך.
OCR הוא זיהוי תווים מתוך תמונה. זה דומה, אבל לא אותו דבר.

עוד הרבה דברים נכתבים ביד, כמו רשימות, טפסים וספרים ישנים.
לפעמים נוח יותר לכתוב ביד מאשר במקלדת.

כדי לחפש או לערוך טקסט שסרקו, צריך להמיר כתב יד לטקסט דיגיטלי.
סריקה נותנת תמונה, אבל לא טקסט לעריכה.

בזיהוי מקוון המחשב עוקב אחרי התנועה של העט בזמן הכתיבה.
הוא רושם את התנועה כקווים X וY.
כך המחשב יודע באיזה סדר נכתבו הקווים.

מחשבי כף יד ניסו לזהות כתב. Palm הצליחה עם Graffiti.
חברות כמו מיקרוסופט השתמשו בבסיס נתונים גדול לשיפור הזיהוי.

בזיהוי לא מקוון קוראים טקסט מתוך תמונה סרוקה.
שיטה זו שימושית בבנקים ובמקומות שעובדים עם נייר רב.

התהליך עובד בשלבים ברורים:
- מוצאים שורות ומילים.
- מיישרים שורות שעקומות.
- מנרמלים גודל אותיות כדי להשוות אותן.
- מנקים רעשים כדי לשפר את הצורה.

כדי לזהות אותיות משתמשים בדרכים שונות:
- השוואת תבניות: להשוות אות לאות שמורות.
- רשת עצבית: מערכת של חישובים שלומדת דוגמאות.
- HMM: מערכת של מצבים שעוזרת לבחור את האות הנכונה.

יש מאגרים גדולים של דוגמאות כתב יד בעולם. UNIPEN הוא דוגמה כזו.
לשפה העברית אין עדיין מאגר גדול כזה.

אם המחשב חלש, צריכים שיטה פשוטה.
אם יש משתמש אחד, כדאי שהתוכנה תלמד את הכתב שלו.

המחשב יכול להמיר הרבה במהירות, אבל לפעמים צריך אדם שיתקן טעויות.

תגובות גולשים

התגובה תפורסם באתר לאחר אישור המערכת

עדיין אין תגובות. היה הראשון להגיב!