UTF-8

UTF-8 היא שיטה לשמור אותיות ומילים במחשב. יוניקוד (טבלה של תווים ומספרים) נותן לכל אות מספר. UTF-8 מכניס את המספרים האלה לתוך בתים (בתים = יחידות מידע קטנות).

קנו את הרעיון קן תומפסון ורוב פייק ב־1992. ב־1993 הרעיון הוצג בפומבי.

יוניקוד אומר איזה מספר שייך לאות. UTF-8 אומר איך לשים את המספר הזה במחשב.

חלק מהתווים נשמרים בבית אחד. תווים נפוצים באנגלית נשמרים בבית אחד. תווים אחרים זקוקים ל־2, 3 או 4 בתים. בתחילת כל בית יש סימן שמראה אם זה הבית הראשון של התו או בית המשכי. זה עוזר אם בית אחד הולך לאיבוד.

לפני כן אפשר היה לכתוב תו בדרך ארוכה יותר. זה שימש לרמייה. היום לא מותר להשתמש בזה.

אם יש קטע מקודד שלא תקין, אפשר:
- להחליף אותו בתו מיוחד כמו "�".
- להתעלם ממנו.
- לדווח על שגיאה.

יתרון גדול: UTF-8 עובדת עם הרבה שפות ועם האינטרנט. לינוקס ו־מערכות רבות משתמשות ב־UTF-8 כברירת מחדל. Java ומחשבי מק משתמשים בגרסאות מיוחדות במקרים מסוימים.

מילות מפתח: UTF-8 יוניקוד בתים ASCII Ken Thompson Rob Pike לינוקס Java

תגובות גולשים

עדיין אין תגובות. היה הראשון להגיב!

תווים -

מילים -

פסקאות -

שורות -

זמן קריאה משוער -

צפיות 3

תגובות גולשים

סטטיסטיקות מאמר

מאמרים קשורים

UTF-8

תגובות גולשים

סטטיסטיקות מאמר

מאמרים קשורים

תו (מחשב)

סיבית

תבנית:חרטומים

UTF-32

מעונות עובדים