Tekst ten ma już prawie 10 lat, ale jak widać cały czas jest aktualny, a na dodatek ma już swoją wartość historyczną :) taka jedna reklama

Po co ogonki?

Cóż, esperanto się nie przyjęło i ludzie mówią i piszą w różnych językach. A różne języki to nie tylko różne gramatyki i słownictwo, ale także różne alfabety. Niemcy mają swoje umlauty, inne nacje jeszcze coś innego, a my "ogonki" - dodatkowe znaki alfabetu, wyrażające takie dzwięki jak "ą" czy "ł". W sumie, we współczesnym języku polskim występuje 9x2 dodatkowych (w stosunku do alfabetu łacińskiego) znaków:

ąćęłńśóźżĄĆĘŁŃŚÓŹŻ

Okazało się niestety, że te głupie 18 znaczków potrafi narobić całkiem niezłego zamieszania, gdy przychodzi do pisania po polsku na komputerze. Dlaczego? Proste - największym rynkiem komputerowym jest rynek amerykański a tam się po polsku nie pisze.

W sytuacji gdy np. programy poczty elektronicznej nie posiadały polskich liter, ludzie po prostu "jakoś" sobie radzili. Mozna bylo pisac nie uzywajac polskich liter - na ogół dawało to zadowalające efekty, choć w takich słowach jak "żądanie" trzeba sobie było radzić w sposób bardziej wyuzdany, tj. specjalnie oznaczać polskie literki - zwykle pisząc: \z\adanie albo z~a~danie.

Nie czarujmy się - takie rozwiązanie było może do przyjęcia na listach technicznych czy naukowych, gdzie i tak dominuje żargon, ale gdzie indziej jest zwyczajnie rażące. To podobnie jak z ortografią - niby nie jest to takie kluczowe, ale spróbujcie np. napisać reklamę waszych usłóg, gdzie będziecie zachwalać swoje dórze umiejętności, to zobaczycie jak to zostanie potraktowane. Po prostu jako niechlujstwo i lekceważenie adresata. I podobnie będzie z tekstem bez polskich liter.

(Pojawiły się też głosy by "upraszczać" język polski, ale to oczywiście raczej tylko temat do żartów).

Kodowania

Sprzęt komputerowy stawał się coraz doskonalszy i choć nadal na ogół oprogramowanie nie uzględniało polskiej specyfiki, to jednak polskie litery coraz częściej dawały się uzyskać, metodami mniej lub bardziej "radosnymi".

Przy bajtowym zapisie każdego znaku około setki kodów (z 256 możliwych) było w praktyce do wykorzystania - wielcy producenci coś tam już powstawiali (np. znaki do rysowania ramek czy niemieckie umlauty), ale nie wszystkie te znaki były niezbędnie konieczne - można je było podmienić polskimi literami. Tylko które?

Na to pytanie odpowiedziano na około 20 sposobów plus mutacje związane ze specyfiką różnych programów (np. program Ventura znak o kodzie 158 traktuje specjalnie, więc kod Mazovia używający tego znaku nie w pełni się nadawał - używano Mazovii "odrobinkę poprawionej").

Wszystkie te "spolszczania" programów były wykonywane po to żeby jakiś program zadziałał a nie po to żeby tworzyć standardy - chaos zrobił się straszliwy. Przez chwilę próbowano lansować kod Mazovii jako "standard faktyczny" (istotnie bardzo wiele drukarek i monitorów Hercules miało ten zestaw znaków), ale wtedy przyszedł Microsoft z IBM-em i wprowadzili nam kolejny "standard" - CP852. Potem Microsoft się rozmyślił i do polskich MS Windows wprowadził CP1250. I teoretycznie takie jest teraz stanowisko Microsoftu - w Polsce i innych krajach Europy Środkowej ma być używane CP1250.

Polska Norma

A co na to wielce szanowne grona normalizacyjne? Ano przede wszystkim nie śpieszyły się - gdy w końcu ustalono Polską Normę, to według wielu już było zbyt późno na przełamanie dominacji Microsoftu. Tym bardziej, że pozornie wyglądało na to, że szanowne gremium sprawiło nam kolejny "standard".

Nie było to wcale jednak takie głupie - Polska Norma została ustalona jako zgodna ze standardem międzynarodowym: ISO-8859-2. To, jakie to ważne, zobaczyliśmy dopiero, gdy pojawił się:

Internet

Początkowo polski Internet był domeną języka "polskawego", ale wraz z upowszechnieniem się WWW a z nim środowiska graficznego, stosowanie polskich liter stało się powszechne. I tu niespodzianka - okazało się, że do Internetu wcale nie musi się przenosić problem mnogości "standardów". Bo w Internecie ten problem jest rozwiązany - standard ISO-8859-2 jest stary i co ważne: uznawany przez najróżniejsze programy i usługi sieciowe. I to właśnie ten standard wybrano nam na Polską Normę.

Co to znaczy uznawany przez usługi sieciowe? Otóż chodzi o to, że Internet jako sieć międzynarodowa musiał wykształcić mechanizmy na współistnienie w sieci różnych języków. Rozwiązano to tak, że ustandaryzowano tzw. nagłówki dokumentów (WWW, listy e-mail, itp.), w których można zapisać między innymi, w jakim języku/alfabecie jest zapisany właściwy tekst. To tzw. MIME.

Dzięki tym nagłówkom programy internetowe wiedzą z jakim tekstem mają do czynienia i mogą dostosować do tego swe działanie. Jeśli np. jakiś Polak w Urugwaju dostanie list z polskimi literami, ale z poprawnymi nagłówkami MIME, to może przeczyta go nawet gdy nie ma u siebie polskich czcionek (fontów) - po prostu dobry program obsługujący MIME mu to przekoduje.

Dla stron WWW dostosowanie się do standardów MIME zwykle oznacza konieczność dopisania do dokumentu specjalnych 3 linijek.

Microsoft

Pięknie. A co na to Microsoft? Hmm. Podszedł do tego ambiwalentnie - z jednej strony w swoich programach wprowadził obsługę standardu, ale z drugiej strony ciągle wygląda, że z uporem godnym lepszej sprawy lansuje swoje CP1250.

Sytuacja jest dość dziwna - z jednej strony Microsoft zapytany wprost, przyznaje że standardem jest ISO 8859-2 i faktycznie internetowe programy Microsoftu akceptują ten standard. Z drugiej strony jednak stanowisko to nie jest zbyt jasno przedstawione użytkownikom tychże programów - wydaje się, że Microsoftowi wcale na tym nie zależy - że wręcz chciałby by powstawały np. wadliwe strony WWW - takie które da się czytać jedynie przy użyciu oprogramowania pod MS Windows. Cóż.

Ale tego typu problemy marketingowe dużych firm Ciebie nie muszą obchodzić: jeśli jakiś program internetowy Microsoftu czy jakiejkolwiek innej firmy nie uwzględnia standardu, albo upiera się przy wysyłaniu w sieć CP1250 (np. serwer WWW czy program pocztowy), to zwróć go sprzedawcy jako produkt nie nadający się do użytku - jak poszukasz, to znajdziesz podobny program konkurencji, który będzie działał dobrze. Naprawdę!

Wszędzie ogonki!

Ostatnią ostoją języka "polskawego" była do niedawna poczta elektroniczna i UseNet (news-y) - zbyt wiele osób używało przestarzałych programów nie obsługujących MIME i ogonki były dla nich zwyczajnie nieczytelne.

Przełom nastąpił w lecie 1996. Stopniowo coraz większa część użytkowników przestawiała się na programy używające MIME. Nowe wersje programów Netscape i Microsoftu również w pełni radzą sobie z MIME. I w tej sytuacji apel jednego z użytkowników polskiego UseNetu o powszechne stosowanie polskich znaków spotkał się z akceptacją - nieomalże z dnia na dzień większość zaczęła pisać z ogonkami. Oczywiście dla niektórych był to problem, ale dostosowali się - teraz na polskich newsach pisze się po polsku!

Dla poczty elektronicznej (e-mail) nie ma tak łatwo - ciągle wszystko zależy od tego z kim się rozmawia. Ale w zasadzie można przyjąć, że domyślnie pisze się po polsku, a na "polskawy" przerzuca się dopiero na wyraźne życzenie rozmówcy. Po prostu jeśli piszesz do kogoś bez polskich liter, to może to zostać odebrane jako objaw lekceważenia (podobnie jak błędy ortograficzne).

Unikod

Większość problemów ze znakami narodowymi byłaby do uniknięcia, gdyby znaki zapisywać nie na jednym ale na dwu bajtach - dostępnych znaków wtedy byłoby nie 256 ale całe mnóstwo. To właśnie jest Unikod (Unicode). A właściwie będzie. Już pomału można go w zasadzie zacząć używać - szczegóły tutaj.

Unikod jest niezastąpiony dla kodowania tekstów wielojęzycznych, ale warto by go stosować także dla tekstów polskich. Na początek proponuję by dla serwerów WWW było sprawdzane czy client obsługuje Unikod (podaje to w żądaniu dostępu) - jeśli tak, to dać mu Unikod zamiast ISO-8859-2. Chwilowo chyba na cokowiek innego jest jeszcze za wcześnie - zbyt mało programów (w zasadzie tylko najnowsze przeglądarki WWW) obsługuje Unikod.


A jak te ogonki uzyskać?

Aaa, faktycznie. Miło mi, że dotrwałeś przy moim opowiadaniu aż dotąd, ale przecież Ty tu przyszedłeś nie po to by czytać moje wypociny, ale by się dowiedzieć, jak ogonki uzyskać na swoim komputerze.

A to właśnie opisuje reszta strony ogonkowej - wybierz rodzaj systemu jaki Cię interesuje (pod jakim pracuje Twój komputer) i tam znajdziesz opisy jak skonfigurować lub jakich programów użyć dla Twoich potrzeb.

A jeśli nie znajdziesz tego, co Cię interesuje?

Powodzenia!


Jarosław Strzałkowski, sierpień 1996.