UTF-16
UTF-16 הוא דרך לכתוב כל אות במחשב. סיבית (יחידת מידע קטנה) היא הבסיס. 16 סיביות שוות לשני בתים. בהתחלה חשבו ש־16 סיביות יספיקו לכולם. אבל נדרשו תווים מיוחדים ותווים משפות שונות. לכן בנו שיטה שמוסיפה אפשרויות. ב־UTF-16 יש "ממלאים" מיוחדים. אלה הם שתי קבוצות של קודים. קוד אחד מהקבוצה הראשונה ואחד...
תו (מחשב)
תו הוא סימון אחד. סימון יכול להיות אות, מספר או רווח. מחשב שומר כל תו כמספר קטן. כאשר מחברים הרבה תווים יחד מקבלים מחרוזת. מחרוזת היא טקסט שאפשר להציג. יש דרכים שונות לקודד תווים. ASCII הוא קידוד ישן. הוא מאפשר 128 תווים. קידודים אחרים כמו ISO 8859 ו‑EBCDIC נותנים 256 תווים. יוניקוד (Unicode) הו...
יוניקוד
יוּנִיקוֹד הוא סט של כללים כדי לכתוב אותיות במחשב. הוא מאפשר לכתוב את כל שפות העולם. לפני יוניקוד היו קידודים קטנים. קידוד זה אומר איך המחשב מקודד אות לביטים. בעיה היתה שמספר אחד יכל לייצג אות שונה במקומות שונים. למשל 224 יכול לייצג את à או את האות א. יוניקוד הוצג לראשונה ב־1988. הגרסה האחרונה עד ...
UTF-32
UTF-32 הוא דרך לכתוב אותיות ומסמלים כמספרים. כל אות תופסת 4 בתים. בית הוא יחידת אחסון של מחשב. בתקופת התכנון היו שני סוגי קידוד: אחד של 2 בתים ואחד של 4 בתים. עם הזמן הוסיפו הרבה תווים ולכן צריך קידוד של 4 בתים. כך נוצר UTF-32. ב־UTF-32 כל תו נשמר בסוף כמספר באורך קבוע. זה מקל על המחשב לקרוא טקסטי...
ISO 10646
ISO 10646 היא רשימה גדולה של כל האותיות והסמלים בעולם. מפת תווים זהו "מפה" של תווים, כלומר איפה כל אות נמצאת. הרעיון החל ב־1989 והטיוטה יצאה ב־1990. בתחילה התוכנית נתנה מקום לעוד הרבה תווים. חלק מהתווים המיוחדים (תווי בקרה) לא הורשו, ולכן נשארו פחות תווים לשימוש. היו שלושה מבצעים איך לקודד תווים: ...
UTF-8
UTF-8 היא שיטה לשמור אותיות ומילים במחשב. יוניקוד (טבלה של תווים ומספרים) נותן לכל אות מספר. UTF-8 מכניס את המספרים האלה לתוך בתים (בתים = יחידות מידע קטנות). קנו את הרעיון קן תומפסון ורוב פייק ב־1992. ב־1993 הרעיון הוצג בפומבי. יוניקוד אומר איזה מספר שייך לאות. UTF-8 אומר איך לשים את המספר הזה...