文字有許多種的編碼方式,另外更有用來指定文字位置的描述語言(description language),以下介紹幾種常見的文字表示法。
使用的最普遍的一種文字編碼法就是美國標準資訊交換碼,在美國國家標準規格中,這種文字編碼法採用7個位元(bit)的編碼,因此可以表示出128個文字。在電腦的使用中,此種文字編碼採用一個位元組(byte)來儲存,因此理論上可以表示256個文字,但多出來的這128個文字並沒有正式的定義,因此許多文字編輯軟體就用這些多出來的範圍定義自己的文字或符號,這便會造成文字間不相容的情形。
下表列出標準的ASCII碼;
除了文字內容之外,使用者也希望能夠編輯文字編排的方式,例如在某個地方讓字形變大、在某段落採用縮排等。標注文字就是一種安插在本文當中用來指定編排方式的一種文字格式,以下面一段標注語言為例:
.ce
This is a test line
這是UNIX作業系統中一種稱為”troff”的格式,”.ce”就是用來描述排版的特殊字元。這個例子會將”This is a test line”這段文字安排在文件的中間。
通常閱讀超文件時需要使用一個瀏覽器(browser),瀏覽器可以將超文件中的文字內容以及含有連結點的地方顯示出來,讓使用者非常方便的讀取。
文字的處理有以下的幾種功能:
基本上文字編輯器可以用來插入一段文字,如下圖: