
|
|
Polskie znaki diaktryczne
Aby teksty napisane po polsku były czytelne na www należy zmienić
polskie litery na odpowiednie znaki ISO 8859-2 lub UTF-8.
Można to zrobić "ręcznie", ale łatwiej używając programów (zresztą
darmowych).
Praktyka
Każdą stronę zaczynam od wpisania poniższego polecenia:
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-8859-2">
Służy one do uruchomienia odpowiedniego standardu kodowania przeglądarki
u odwiedzającego.
Znaki diaktryczne w krótkich tekstach koduję "ręcznie" wymieniając
litery na znaczniki. Wśród własnych poleceń zazwyczaj używanego
edytora tekstowego The Web Media Publisher mam przykład w ISO 8859-2, który kopiuję do kodu i znaki diaktryczne zamieniam na znaczniki:
<!- Ą ą Ć ć Ę ę Ł ł Ń ń Ó ó Ś ś Ź ź Ż ż -->
Jeżeli pracuję w Windows, to poprawiam teksty pisane bez "ogonków"
używając korektora "Polish Spell-checker" dla Worda 6.0.
Jeśli pracuję w Macintoshu, to do tego samego celu używam korektora
"Polski Słownik" dla ClarisWorks.
Do zmiany standardu CP 1250 na ISO 8859-2 używam narzędzi opisanych niżej.
Czasem stosuję inną metodę: w gotowych stronach, zakodowanych
w CP 1250 (najczęsciej używam CP 1252), wymieniam niestandardowe znaczniki na ISO 8859-2, korzystając z funkcji Edit --> Multi File Replace wspomnianego edytora. Dla łatwego ich znalezienia mam odpowiedni
przykład w zbiorze własnych poleceń:
<!-- Ľ š -->
Podobną procedurę stosuję w Macintoshu, gdzie używam edytora tekstowego
BBEdit.
Narzędzia
Dla Windows rewelacyjnym programem konwertującym są Ogonki 97. Można nim łatwo zmienić CP 1250 na ISO 8859-2 lub Unicode.
Dla Macintosha istnieje kilka darmowych programów, wsród których
wyróżnia sie Konwerter zawierający narzędzia do konwersji plików tekstowych autorstwa
Roberta Miklasa.
Często spotykane błędy
Najpopularniejszym błędem w kodowaniu polskich znaków diaktrycznych
jest stosowanie standardu CP 1250 zamiast ISO 8859-2.
Jego źródłem jest zazwyczaj użycie tekstu sporządzonego, w jedym
z edytorów firmy Microsoft lub ignorancja konstruktora strony.
Roztargnieni webdesignerzy zapominają też o zmianie kodu którejś
(lub wszystkich) z pokazanych niżej sześciu liter:
| ISO 8859-2 |
ZNACZNIKI |
CP 1250 |
KRZACZKI |
| Ą |
 |
Ľ |
 |
| ą |
 |
š |
 |
| Ś |
 |
|
 |
| ś |
 |
ć |
 |
| Ź |
 |
|
 |
| ź |
 |
|
 |
Niektóre ze znaków diaktrycznych mogą być widoczne jak prawidłowo
zakodowane (w edytorach i przeglądarkach konstruktorów stron www),
ale nie znaczy to, że tak samo będą wyglądały w przeglądarkach
innych komputerów. Dlatego warto porównać własne znaczniki ze
znajdującymi się na tej stronie lub na stronach zawierajacych
ich zestawy: ISO 8859-2 oraz ISO 8859-1.
Większość znaczników ISO 8859-2 pokazałem z pomocą &kodu;, ale użyłem ilustracji dla zademonstrowania rzeczywistego wyglądu
tych znaczników, które zmieniłyby wygląd ze względu na rodzaj
kodowania strony.
W komputerach z systemem Windows wszystkie znaczniki (w obu tabelach)
powinny pokazać się prawidlowo, a w Macintoshu zamiast niektórych
znaczników ujrzymy znak zapytania.
Strony "ogonkowe"
Jedna z najstarszych stron popularyzujących kodowanie polskich
znaków w ISO 8859-2 znajduje się w Centrum Innej Sztuki. Natomiast wyczerpujące informacje o kodowaniu polskich znakow
diaktrycznych można znaleźć na Polskiej Stronie Ogonkowej AGH lub w SUNSITE.
Wśród "ogonkowych" tematów szczególnie interesujacą wydaje się
być strona Ogonki 97 Michała Jaskólskiego.
Polskie znaki diaktryczne według Polskich Norm
| Znacznik HTML 2.0 |
Ilustracja |
| Ą |
 |
| ą |
 |
| Ć |
 |
| ć |
 |
| Ę |
 |
| ę |
 |
| Ł |
 |
| ł |
 |
| Ń |
 |
| ń |
 |
| Ó |
Ó |
| ó |
ó |
| Ś |
 |
| ś |
 |
| Ź |
 |
| ź |
 |
| Ż |
 |
| ż |
 |
| Znacznik HTML 2.0 |
Ilustracja |
|