UTF-8


UTF-8 היא שיטה לשמור אותיות ומילים במחשב. יוניקוד (טבלה של תווים ומספרים) נותן לכל אות מספר. UTF-8 מכניס את המספרים האלה לתוך בתים (בתים = יחידות מידע קטנות).

קנו את הרעיון קן תומפסון ורוב פייק ב־1992. ב־1993 הרעיון הוצג בפומבי.

יוניקוד אומר איזה מספר שייך לאות. UTF-8 אומר איך לשים את המספר הזה במחשב.

חלק מהתווים נשמרים בבית אחד. תווים נפוצים באנגלית נשמרים בבית אחד. תווים אחרים זקוקים ל־2, 3 או 4 בתים. בתחילת כל בית יש סימן שמראה אם זה הבית הראשון של התו או בית המשכי. זה עוזר אם בית אחד הולך לאיבוד.

לפני כן אפשר היה לכתוב תו בדרך ארוכה יותר. זה שימש לרמייה. היום לא מותר להשתמש בזה.

אם יש קטע מקודד שלא תקין, אפשר:
- להחליף אותו בתו מיוחד כמו "�".
- להתעלם ממנו.
- לדווח על שגיאה.

יתרון גדול: UTF-8 עובדת עם הרבה שפות ועם האינטרנט. לינוקס ו־מערכות רבות משתמשות ב־UTF-8 כברירת מחדל. Java ומחשבי מק משתמשים בגרסאות מיוחדות במקרים מסוימים.

תגובות גולשים

התגובה תפורסם באתר לאחר אישור המערכת

עדיין אין תגובות. היה הראשון להגיב!