"תו" (Character או Char) הוא יחידת מידע אחת בתכנות. זה מייצג סימול אחד, כמו אות, ספרה או רווח. ברוב השפות תו נשמר כערך מספרי שמחשב יכול לעבד.
רצף של תווים נקרא מחרוזת. מחרוזת היא דרך לשמור טקסט שניתן להציג או לעבד בתוכנה.
שמות קידודים נפוצים: ASCII (קידוד ישן שבו תו תואר בעזרת 7 סיביות; סה"כ 128 תווים), ו־ISO 8859 ו־EBCDIC (כל אחד מהם משתמש ב‑8 סיביות; סה"כ 256 תווים). יוניקוד (Unicode) נועד להכיל תווים מכל השפות. בגרסאות הראשונות יוניקוד השתמש ב‑16 סיביות, וזה נתן 65,536 תווים. בגרסה 2.0 יוניקוד הורחב כדי לתמוך ב‑1,112,064 תווים בעזרת מנגנון בשם UTF‑16, שבו נעשה שימוש בקודים מיוחדים כדי לייצג תווים נוספים.
תווים מיוצגים על ידי סיביות (bits) בבינארי, אבל נוח לכתוב אותם בהקסדצימלי (כתיבה ביסוד 16). דוגמה מוכרת: הערך 0xC1 בקוד EBCDIC מייצג את האות A.
בישראל נהוג לפעמים להגיד "צ'אר" בגלל ה‑Ch ב‑Char. ההגייה הנכונה בעברית היא "קאר". תו חשוב כי הוא מאפשר לשמור כל סימן כמחרוזת באורך 1. בנוסף, ניתן להשתמש בסוג Char לשמירת ערכים מספריים קטנים או תווים בודדים, כולל אותיות קטנות וגדולות.
תו הוא סימון אחד. סימון יכול להיות אות, מספר או רווח. מחשב שומר כל תו כמספר קטן.
כאשר מחברים הרבה תווים יחד מקבלים מחרוזת. מחרוזת היא טקסט שאפשר להציג.
יש דרכים שונות לקודד תווים. ASCII הוא קידוד ישן. הוא מאפשר 128 תווים. קידודים אחרים כמו ISO 8859 ו‑EBCDIC נותנים 256 תווים.
יוניקוד (Unicode) הוא קידוד גדול. בתחילה הוא תמך ב‑65,536 תווים. אחר כך הוא הורחב, וכעת הוא יכול לכלול מעל מיליון תווים בעזרת שיטה שנקראת UTF‑16. זה מאפשר לכתוב בכל שפה בעולם.
מחשבים משתמשים בסיביות (bits). סיביות הן יחידות מידע קטנות. מקל יותר לכתוב ערכים בהקסדצימלי (ספרות בבסיס 16). למשל 0xC1 בקוד EBCDIC הוא האות A.
בישראל קוראים לפעמים לתו "צ'אר". ההגייה המדויקת היא "קאר". תו חשוב כי הוא שומר תמיד רק סימון אחד.
תגובות גולשים