UTF
Stajališta za "unicode Format transformacije. "UTF se odnosi na nekoliko vrsta Unicode-a kodiranje znakova, uključujući UTF-7, UTF-8, UTF-16 i UTF-32.
- UTF-7 - koristi 7 bitovi za svaki lik. Dizajniran je da predstavlja ASCII znakova u e-mail poruke koje zahtijevaju kodiranje Unicode.
- UTF-8 - najpopularnija vrsta Unicode kodiranja. Koristi jedan bajt za standardna engleska slova i simbole, dva bajta za dodatne latinične i bliskoistočne znakove, i tri bajta za azijske znakove. Dodatni znakovi mogu se predstaviti pomoću četiri bajta. UTF-8 je unatrag kompatibilan s ASCII, jer se prvih 128 znakova preslikava na iste vrijednosti.
- UTF-16 - proširenje Unicode kodiranja "UCS-2", koje koristi dva bajta za predstavljanje 65,536 znakova. Međutim, UTF-16 također podržava četiri bajta za dodatne znakove do jednog milijuna.
- UTF-32 - višebajtno kodiranje koje predstavlja svaki znak s 4 bajta.
Većina teksta u dokumenti i web-stranica je kodiran pomoću jednog od gornjih UTF kodiranja. Puno obrada riječi programi ne dopuštaju pregled kodiranja znakova otvorenih dokumenata, iako neki prikazuju kodiranje na dnu prozora dokumenta ili unutar svojstava datoteke. Ako želite vidjeti vrstu kodiranja znakova koju koristi web stranica, možete odabrati za pregled HTML stranice. Ako je definirano, kodiranje znakova bit će u odjeljku zaglavlja, pri vrhu HTML-a. Stranica koja koristi UTF-8 kodiranje može sadržavati jedan od sljedećih isječaka teksta u nastavku, ovisno o verziji HTML-a.
XHTML: <meta http-equiv = "Vrsta sadržaja" sadržaj = "tekst / html; charset = utf-8" />
HTML 5: <meta charset = "UTF-8">