|
Wyszukiwarka software'u |
Blog > Komentarze do wpisu
Unicode górą
Jak podał The Officlal Google Blog, Unicode stał się w grudniu ubiegłego roku najpopularniejszym systemem kodowania znaków w WWW, przewyższając minimalnie po raz pierwszy, z udziałem 26%, systemy US ASCII i Western 8859-1 i 1252. W 2001 roku Unicode był na poziomie zera, a US ASCII miał ok. 57% udziału. Nie znam danych dla polskich stron, ale chyba ciągle zdecydowanie dominuje ISO 8859-2, prawdopodobnie nie tylko dzięki temu, że upowszechnił się jeszcze w ubiegłej dekadzie jako poprawny standard, rugując Windows-1250, ale i temu, że wspierają go główne platformy blogowe. To bez wątpienia symboliczny kamień milowy - czy w połowie przyszłej dekady będzie to już 90%? Na dobrą sprawę kodowanie unikodowe powinno się stać warunkiem poprawności stron, bo chyba nikt przy zdrowych zmysłach nie zaprzeczy, że jest najsensowniejszym rozwiązaniem. Oby tylko wszystkie elementy układanki znajdowały się na swoich miejscach. wtorek, 06 maja 2008, prwimmer
TrackBack
Komentarze
2008/05/06 08:08:57
ISO na stronach dominuje, gdyż w większości są to witryny nieaktualizowane od lat. Wiadomo jak to wygląda w Polsce. Witryna internetowa firmy staje się niekiedy dla niej po prostu ciężarem. Świadomość potrzeby jej aktualizacji wykazuje niewiele firm.
2008/05/06 20:22:18
@Godric - czyli nie wszystkie klocki są na miejscu. To moim zdaniem kwestia jeszcze kilku lat. ZU w ogóle nie musi wiedzieć, co tam siedzi w środku - ma działać, i tyle. :-)
2008/05/07 07:46:51
Dokładnie tak! ;-) Przejście Gazety na Gmaila to już krok w dobrym kierunku (ciekawe kiedy Bloxa przeniosą na Bloggera... :-P ), a Windows już chyba nie ma takich problemów z obsługą Unicode, jak kiedyś. Więc są szanse, że już za pięć, dziesięć lat...
A co do starych witryn - owszem, sporo staroci jeszcze jest, ale te nowsze też są tworzone w ISO. |
Unicode obsługiwał poprawnie tylko Gmail i jeden z polskich systemów. Z pozostałych dwa przekodowywały Unicode do ISO (w najprostszy sposób, przez podstawianie polskich liter i ignorowanie wszystkich pozostałych), natomiast reszta nawet tego nie robiła, wyświetlając krzaki zamiast polskich liter. Poza tym psuły nagłówki i całkowicie rozwalały kodowanie odpowiedzi.
Co więcej, Outlook ma zwyczaj gubić niektóre ustawienia przy odpowiedzi na maila w Unicode - rozjeżdża sie wcinanie wypowiedzi, więc nie wiadomo, kto co napisał - nadawca czy odbiorca.
W rezultacie wyszło na to, że nie ma sensu w Polsce wysyłać do polskich adresatów maili w Unicode, bo po prostu nie są w stanie przeczytać krzaków i gubią sens wypowiedzi.
Od tego czasu jest lepiej o tyle, że Gazeta porzuciła własny system i przerzuciła się na Gmaila. Niestety, w tym wypadku mamy równanie w dół, do najgorszego. Nie da sie przekonać ludzi do Unicode, dopóki będzie im się kojarzyć z niezrozumiałymi mailami.
Zresztą, jeśli się dokładnie przyjrzeć, to w blogach sytuacja jest praktycznie taka sama. Blox używa ISO, blogi Onetu też, o Mylogu, Ownlogu i całej reszcie nie wspominając. Chyba jeden Jogger się tu pozytywnie wybija.
A ludzie w większości (i to ogromnej większości) nie mają nawet pojęcia, o co chodzi z tym całym kodowaniem. Zakładają blogi na tej platformie, którą im polecają znajomi, a to, jak są one kodowane, zupełnie ich nie obchodzi - nawet nie wiedzą, że jest jakiś wybór.