Demokratizace znaků

1162

Psaní – ať už na klávesnici, nebo rukou – je velice osobní záležitost. Přitom však zcela samozřejmě používáme určitý soubor znaků: něco tak veřejného, jak si jen dokážeme představit. A, B i C jsou totiž již po tisíciletí public domain.

Přístup k velice kvalitním (případně velice špatným) písmům pro sazbu nebyl ještě nikdy tak snadný a levný jako v tomto století. Naštěstí se dnes už litery neváží v kilogramech olova ani se nepočítají v hodinách práce na drahých fotosazbových strojích. Díky počítači jako univerzálnímu nástroji dokonce v posledních desetiletích „sazba“ a „psaní“, tedy typografie a psaní na stroji, srostly v jedno. Tím získaly i milióny laiků přístup k typografickým znakům. Na horizontu se teď rýsuje další krok vývoje: globalizace typografie. Většina kultur v dnešním světě již používá počítače, a chtějí samozřejmě používat i vlastní písma. Znakové systémy jako arabština, hebrejština, mongolština, thajština nebo nesčetné čínské ideogramy kladou na typografii a počítače nové požadavky. Vývoj směrem k vícejazykovému zpracování textu šel rychle a pokročil už daleko.

V roce 1963 byla vyvinuta první verze American Standard Code of Information Interchange, krátce ASCII. Jak již jméno napovídá, ani zdaleka tehdy inženýři IBM okolo Boba Bemera neměli v plánu definovat nějaký celosvětově platný standard. Dnes ovládá ASCII celý svět: vynálezy jako internet (a jeho předchůdce ARPA-Net, 1969) nebo e-mail (1971) by byly bez jednotného kódování znaků nemyslitelné. ASCII, povýšené na ISO 646, je dnes po DNA nejúspěšnějším kódem.

ASCII má jen jednu nevýhodu – můžete s ním psát pouze anglické texty. Německé přehlásky, české háčky či francouzské akcenty si tu neškrtnou. Teprve v osmdesátých letech byly zavedeny takzvané osmibitové kódy s 256 znaky, které již šířeji pokrývaly speciální znaky v latince. ISO Latin-1 je široce rozšířený standard. Na prvních 128 pozicích převzal znaky ASCII, dále však zůstal dítětem studené války: diakritika západních jazyků je pokryta kompletně, ale na mnohá východní znaménka se nedostalo – tím se stala jaksi typograficky druhořadá, nekompatibilní s ostatním světem. Mnohým čtenářům budou právě problémy s různými osmibitovými sadami důvěrně známé.

 

 

Vyvstala tedy potřeba zvětšit rozsah kódu a tím i zásobu znaků. Již v roce 1981 navrhují programátoři Apple a Xeroxu okolo Josefa D. Beckera univerzální kód, který pokryje znaky celého lidstva. Tato zdánlivá utopie je dnes už na každém moderním počítači realitou. V roce 1990 byl představen Unicode 1.0, jehož Basic Multilingual Plane (BMP) zahrnuje 16 bitů, tedy 65 536 možných znakových pozic. Záhy se ukázalo, že ani to nestačí k zařazení všech písem, která jsou na světě. Jen čínština potřebuje okolo 70 000 znaků. Navíc se ozvaly hlasy, které chtěly pro vědecké účely integrovat i vymřelé znakové systémy, například klínové písmo. Záměrem ISO 10646 je vytvořit pomocí 32bitového kódu dostatek místa jednou provždy. Tato norma umožňuje kódovat přesně 2 miliardy, 147 miliónů, 483 tisíc a 648 znaků. To už je i pro odborníky jako Richard Gillam clearly overkill. Norma dnes počítá s omezením na prvních 17 úrovní, přičemž každá úroveň obsahuje 65 536 míst. Dohromady je tedy prostor pro 1 114 112 znaků, což by mělo lidstvu pro začátek stačit… Aktuální verze Unicode 4.1 (2005) kóduje přes 97 000 znaků z desítek kultur. Na každém Macintoshi nebo PC s moderními verzemi operačních systémů k nim máme přístup.

Nabízí se pojem typografická revoluce: byla zosnována programátory, veřejností takřka nepovšimnuta, zato v typografické obci vešla ve známost díky formátu OpenType (založeném právě na unicodu). Za neziskovou organizací Unicode Consortium dnes stojí nejdůležitější zástupci počítačového světa: Adobe, Apple, IBM, Microsoft, Oracle, Sun. Za patnáct let se unicode prosadil jako nezpochybnitelný světový standard. Svůj smysl má v mnoha oblastech, například při pouhé lokalizaci softwaru přináší jedno kódování pro celý svět obrovské hospodářské výhody.

Principem unicodu je rozlišení znaku (angl. character) a glyfu: kóduje znaky, nikoliv glyfy. Znaky jsou abstraktními reprezentanty nejmenších prvků psané řeči, mají sémantickou hodnotu.

V unicodu jsou již svým písmem zastoupeny všechny důležité kultury. Víc a víc programů je s unicodem kompatibilních. Průmysl se dnes snaží tento standard co nejdříve dovést do konce. Přitom celá titánská práce je hotova teprve z poloviny. Mnohé žijící i vymřelé kultury v unicodu stále chybějí, protože pro počítačový průmysl nejsou významné. Tady se celá záležitost dostává na pole politiky. Samozřejmě, příští aktualizace unicodu musí pojmout bez výjimky písma všech kultur: unicode je jakýmsi generálním shromážděním typografického OSN a každá kultura má právo na to, aby zde byla zastoupena.

 


BlockDock. Pomocí flashové navigace máme jednoduchý přístup ke 105 blokům unicodu. Každý znak symbolicky zastupuje jeden druh písma nebo skupinu znaků.

 

Pokud totiž nějaká kultura či národ svým písmem v unicodu zastoupena není, vylučuje se tím na základní komunikační úrovni ze světového společenství a těžko se může na poli moderních technologií dále rozvíjet. Iniciativa Script Encoding lingvistky Debory Andersonové z univerzity v Berkeley si klade za cíl dosáhnout přijetí znakových sad, které dosud chybějí.I když už je nějaké písmo do unicodu přijato, čekají na něj další překážky. Pro příslušný jazyk (resp. jazyky) je ještě třeba lokalizovat operační systémy a programy. Aktuálně probíhá initiativa KhmerOS v Kambodži. Toto sdružení bojuje za kambodžskou lokalizaci operačního systému. Představte si, jak by se bouřila Evropa, kdyby všechny vysoké technologie byly dostupné jen v angličtině nebo dokonce v cizích písmech! I když dnes díky unicodu lokalizace softwaru není až takový problém, přece jen si mnohé firmy tyto náklady ušetří, zvláště když softwarové pirátství v chudých zemích ničí veškerý trh. Ale když nejbohatší muž světa ani v budoucnu nenabídne operační systém pro Khmery, převezmou tuto úlohu opensourceové skupiny a Microsoft přijde v těchto zemích navždy o možnost výdělku. Kambodža má ostatně 13 milionů obyvatel.

Jiný příklad: po porážce Talibanu zjistili západní vojáci, že pro paštu a dari, oficiální jazyky v Afghánistánu, chybějí na klávesnicích některé arabské znaky. Program podporovaný OSN v roce 2003 tyto znaky do unicodu doplnil a také vyvinul pro paštu vlastní klávesnici. Tamní kultuře se tak poprvé otevřela možnost komunikovat přes počítač vlastním písmem. Zdánlivě všední technický vývoj, ovšem s nevídaným kulturním dosahem.

Stejně jako se zdála být utopickou před dvaceti lety Beckersova myšlenka o mnohojazyčném zpracování textu, může dnes znít bláznivě požadavek, aby byl internacionálně zaměřený software lokalizován pro všechny živé kultury.

Tvůrcům písma tak unicode předkládá novou výzvu. Idylické doby 256 znaků v jednom fontu minuly. I takzvané expertní sady byly jen částečným řešením, které dnes již nefunguje. Jeden „celosvětový font“ technicky nemá význam, ale stále více tvůrců písma si dnes dává záležet, aby vybavili své latinky alespoň kompletní východní diakritikou, řeckou abecedou a azbukou.

Nový formát pro písma OpenType je založen na unicodu. Díky němu se vzájemně nekompatibilní fonty pro Mac a PC stávají minulostí. Přesto skutečnost, že nějaký font je nabízen jako OpenType, ještě neříká nic o tom, kolik znaků doopravdy obsahuje. Někteří výrobci si zjednodušují práci a stará písma jednoduše konvertují, aniž přidávají nové znaky. Jiní již udávají počet glyfů ve fontu. Jeden znak tu ale může zastupovat více glyfů. V loňském roce vydaný Mrs. Eaves OpenType Zuzany Ličko obsahuje v jednom souboru celých 17 „starých“ osmibitových fontů.

Marshall McLuhan v roce 1963 řekl: „We shape tools and they in turn shape us.“ – I já věřím, že demokratický přístup ke všem znakům světových písem trvale změní typografii, lingvistiku a mnoho dalších věd jako paleografii nebo archeologii.

Co nám teď schází, je přehled o všech těch znacích, které se pod klávesnicí skrývají. Programátoři unicodu odvedli dobrou práci, ale ani mnohým odborníkům není jasné, co které znaky znamenají. Musíme je rozklíčovat!

 


Pohlednice. Sada pohlednic s 36 zvláštními nebo vzácnými znaky z unicodu ve třech různých neonových barvách. Sadu je možné objednat na  www.decodeunicode.org

 

Decodeunicode je nezávislá platforma, která se otevřela on-line v květnu 2005 se jmény a zobrazením více než 50 000 znaků. Projekt společně připravili a nastartovali prof. Johannes Bergerhausen spolu s designérkou Siri Poarangan na katedře designu v Mainzu.

Projekt podporovaný německým ministerstvem pro vzdělávání a výzkum chce připravit půdu pro základní typografický výzkum a uživatelům počítačů má osvětlit význam všech znaků. Všechny informace ke každému jednotlivému znaku jsou zajímavé: historie, rozšíření, různé významy, ortografické použití, typografické poznámky, anglický unicodový název, synonyma a hovorové názvy, obrázky příkladů.

Decodeunicode funguje jako OpenScience projekt, staví na příspěvcích on-line uživatelů. Informace se vkládají podobně jako ve Wikipedii. Můžete ke každému znaku uploadovat i obrázek, pokud je volně šiřitelný – vítána jsou jak klasická typografická vyobrazení, tak fotografie všedního užití. Pro zajištění kvality jsou příspěvky dodatečně kontrolovány moderátory z Fachhochschule v Mainzu (ti je případně mohou i smazat). Vedle obrázků můžete přidávat například hovorové názvy, které jsou potřebné zvláště pro fulltextové vyhledávání – zkuste si někdy třeba zadat do vyhledávače „Sputnik“.

Při přípravě vyobrazení znaků bylo často obtížné k některým písmům vůbec najít příslušný font. Jsou znaky, které používá jediný ostrovní národ s deseti tisíci příslušníky. Více než 50 000 znaků je tedy k dispozici v podobě gifových náhledů, aby byly zobrazitelné i pro uživatele, kteří daný font na počítači nemají.Současná on-line databáze komunikuje německy a anglicky, více jazyků zatím náš malý tým nemůže zvládnout. (Kdo by chtěl otevřít českou verzi, může se přihlásit u autora článku.)

Mezi zamotanými arabskými ligaturami, složitými čínskými ideogramy a stovkami matematických značek se dá objevit mnohé – zkuste si u nás nechat vyhledat řeba „3“ nebo „star“… Těšíme se na vaše příspěvky.  

[překlad: Jan Dobeš]

 

Charles E. Mackenzie: Coded Character Sets, History and Developement, Boston, MA, USA, 1980, ISBN 0-201-14460-3
Johannes Bergerhausen: Questionner le clavier: les Codages ASCII et ISO-Latin 1, Dossier CNAP, Paris, France, 1999
Joseph D. Becker: Multilingual Word Processing in: Scientific American No. 251, July 1984, Seiten 96-107
Richard Gillam: Unicode Demystified, Boston, MA, USA, Addison-Wesley, 2003, ISBN 0-201-70052-2
The Unicode Consortium: The Unicode Standard Version 4.0, Boston, MA, USA, Addison-Wesley, 2003, ISBN 0-321-18578-1
The Unicode Consortium: www.unicode.org/consortium/consort.html (12th June, 2005)
Deborah Anderson: www.linguistics.berkeley.edu/~dwanders (14th June, 2005)
www.khmeros.info (12th June, 2005)
Marshall McLuhan: Understanding Media—The Extensions of Man, New York, NY, USA, McGraw Hill, 1964, ISBN 0-07-045436-1
10 wikipedia: www.wikipedia.org (12th June, 2005)

 

Článek vyšel v časopise TYPO.16.