logo web stranice ic.ims.hr
IZBORNIK HOME FORUM ACCESS WORD EXCEL WORD

 .

 
   
HOME
FORUM Win Tips&Tricks
   
Kako instalirati
WINDOWS 8
Kako instalirati
WINDOWS 8 sa USB-a
Kako instalirati
WINDOWS 7
Kako instalirati
WINDOWS 7 sa USB
Kako instalirati
WINDOWS XP
Kako instalirati Win XP
sa USB Sticka
Kako instalirati
Windows Server 2003
Kako instalirati
Windows 98SE
Naučite za 15 minuta raditi u Windows XP
Naučite Internet Explorer i Outlook Express
za 15 minuta
Kako kreirati BOOT CD za instalaciju Win95
Kako kreirati BOOT CD za instalaciju Win98SE
   
MS OFFICE 2003
MS OFFICE 2007
MS OFFICE 2010
MS OFFICE 2013
   
HOME NETWORK
tutorijal za mreže
Ad Hoc USB Wireless Network
Network Windows 7 - XP
   
ZANIMLJIVI LINKOVI
BROJEVNI SUSTAVI
(DEC, OKT, BIN, HEX )
CMD - Command Prompt
CISCO - CCNA tutoriali
VLSM and SUBNETTING
   
Tutorijali za phpBB forum
JAVASCRIPT
VISUAL BASIC 6.0
VBA U EXCELU
AUTOCAD 2007
AUTOCAD 2010
progeCAD tutorijali
   
REZOLUCIJA MONITORA
KONTAKT
   
   
 
  Croadria link
Kako konvertirati encoding windows-1250 u UTF-8, Convert encode from ANSI to UTF-8, Konvertiranje ANSI u UTF-8 u višestrukim HTML datotekama u folderima i subfolderima, odjednom, Convert ANSI to UTF8 in multiple HTML files in multiple folders and subfolders

Kako konvertirati encoding windows-1250 u UTF-8 u više HTML datoteka odjednom koje se nalaze u folderu i subfolderima

Search This Web Site




Konvertiranje ANSI u UTF-8 u višestrukim HTML datotekama u folderima i subfolderima, odjednom

Ako čitate ovaj tutorijal, vjerojatno imate problema sa encodingom vaših datoteka (Character encoding). Na internetu možete pronaći dosta tutoriala koji opisuju konvertiranje ANSI ili windows-1250 encode u UTF-8 (Code page 1250) . Jedan od najčešćih je preko Notepad++ koristeći Phyton programsku aplikaciju i uz to plugin kao i neku skriptu koja vrši konverziju. Međutim to baš ne ide kako treba (bar kod mene) pa sam odlučio za drugačiji pristup konvertiranja iz windows-1250 u UTF-8 encoding. U ovom tutorijalu prikazati ću kako možete u nekoliko koraka konvertirati encoding iz windows-1250 u UTF-8.

Uzmimo za primjer da imate više desetaka klasičnih web stranica sa extenzijom *.html koje su smještene u više foldera i subfoldera. Ove datoteke su kreirane nekim programom i imaju charset windows-1250. Dakle, encoding je windows-1250 koji podržava hrvatska slova (Č,Š,Ć,Đ,Ž). Odličan program u kojem možete vidjeti encoding vaše HTML stranice je Notepad++.

Na slici ispod uočite folder Temp na C: particiji koji sadrži više foldera i subfoldera. U njima s enalazi više desetaka HTML datoteka, koje imaju encoding windows-1250, što možete vidjeti u source kodu koji je prikazan u Notepad++.

ANSI Encoding HTML file windows-1250

U Notepad++ postoji jednostavan način kako izvršiti promjenu (konvertiranje) encodinga iz windows-1250 u UTF-8.
Otvorite padajući izbornik Encoding => Convert to UTF-8. No problem je kada imate više desetaka ili stotina web stranica koje treba konvertirati u UTF-8

Za konverziju iz windows-1250 u UTF-8 prema ovom tutorijalu potrebno je da imate slijedeće preduvjete

  • Izvršite download Notepad++ programa za editiranje datoteka i instalirajte ga
  • Izvršite download UTFCast Express programa za konverziju u UTF-8 u TXT datotekama i instalirajte ga

Pratite slijedeće korake za konvertiranje ANSI encodinga u UTF-8

Korak 1

Kreiranje foldera na C particiji

Kreirajte dva foldera na nekoj particiji. Npr C:\Temp\ i C:\Temp2\

Korak 2

Kopiranje samo HTML datoteka u više foldera i subfoldera (Copy only HTML files from multiple folders and subfolders)

Kopirajte sve HTML datoteke sa folderima i subfolderima u C:\Temp\ mapu. Pretpostavljam da u folderima i subfolderima imate i drugih datoteka koje nisu HTML extenzije. Da bi kopirali samo *.html datoteke iskoristite mogućnost Total Commandera kojem prilikom kopiranja možete zadati opciju da kopira samo *.html files.

Korak 3

Rename all files from HTML to TXT extension

Pokrenite CMD prompt (DOS prozor). Pozicionirajte se u folder C:\Temp\ i unesite naredbu
forfiles /S /M *.html /C "cmd /c rename @file @fname.txt" - sada imate preimenovane sve datoteke u *.txt

Convert multiple files extension from HTML to TXT

Korak 4

Convert encoding windows-1250 to UTF-8 in multiple *.txt files in folders and subfolders

Pokrenite UTFCast Express program i browsajte do source i destination foldera, kliknite na Start ipokrenuli ste aplikaciju za konvertiranje iz ANSI u UTF-8 u svim TXT datotekama.

Multiple TXT files in multiple folders and subfolders  Convert from ANSI to UTF8

Uočite source i Output datoteke na slici iznad u kojima je uspješno izvršena konverzija iz ANSI windows-1250 u UTF-8. Otvorite jednu od konvertiranih TXT datoteka da pogledate kako izgleda konvertirana datoteka u kojoj je encoding UTF-8. Na slici ispod uočite da datoteka ima encoding UTF-8 ali naredbena linija za meta tag "charset=windows-1250". Ovaj "charset" moramo zamjeniti u UTF-8 pomoću Find and Replace naredbe u Notepad++

Converted TXT file from ANSI to UTF-8

Korak 5

Multiple replace charset windows-1250 encoding to UTF-8 from multiple folders and subfolders in multiple TXT files at once

  1. Pokrenite instalirani Notepad++
  2. Na tekstualnom izborniku kliknite Search => Find in files
  3. Na kartici (Tab) Find in files unesite tekst kao na slici ispod. Obavezno uključite opcije 5 i 6
  4. Nakon uređenih postavki pokrenite zamjenu teksta klikom na Replace in files gumba
  5. Nakon klika pojavljuje vam se potvrdni prozor na kojem potvrdite OK da želite izvršiti zamjenu teksta
  6. Zatvorite Notepad++ klikom na Close button

Možda se pitate zašto sam postavio dugačak tekst koji tražim i mijenjam tj. zašto nije dovoljno upisati samo osnovne riječi teksta (windows-1250/UTF-8). Zato što postoji mogućnost da se možda u nekoj datoteci nalazi dotični tekst koji nije vezan za encoding pa će i on biti zamijenjen a mi to ne želimo. Match case opcija znači da tražimo isključivo navedeni tekst u dotičnom obliku i rasporedu znakova.

Find and Replace text in multiple files and subfolders

Pokrenite Notepad++ ponovno i učitajte neku *.txt datoteku iz foldera C:\Temp2\. Uočite da sada oba elementa sadrže UTF-8 encoding (meta tag i txt datoteka)

UTF-8 encoding in files

Korak 6

Convert extension of multiple files from *.txt to *.html

Dakle, sa prvim dijelom smo završili, sada je potrebno vratiti HTML extenzije za sve datoteke koje se nalaze u folderima i subfolderima. Opet ćemo iskoristiti Windows Command Line (CMD) promt i naredbu FORFILES. Dakle, ponovno konvertiranje extenzija za sve files ali ovaj puta iz *.txt u *.html

Pokrenite CMD prompt (DOS prozor). Pozicionirajte se u folder C:\Temp2\ i unesite naredbu
forfiles /S /M *.txt /C "cmd /c rename @file @fname.html"- sada imate preimenovane sve datoteke u *.html

Rename multiple files from TXT to HTML extension

Korak 7

I na kraju sve datoteke u folderima i subfolderima su konvertirane u HTML extenziju. Pokrenite Notepad++ i provjerite nekoliko datoteka u folderima i subfolderima. Sve datoteke bi trebale imati UTF-8 encoding. Pokrenite ih u vašem browseru i uočite jesu li ispravno prikazani svi karakteri (znakovi Š, Đ, Č, Ć, Ž).

Adsense sponzor



Encode UTF-8 in HTML files

REZIME:

  1. Višestruka konverzija ekstenzije svih datoteka iz *.html u *.txt
  2. Koristeći UTFCast program, višestruka konverzija encodinga u UTF-8
  3. Koristeći Notepad++, višestruki Find/Replace in files, windows-1250 u UTF-8
  4. Višestruka konverzija ekstenzije svih datoteka iz *.txt u *.html

Također pogledajte ostale Code page

 



   

Adsense sponzor




Ova web stranica koristi COOKIES - COPYRIGHT © - 2005 - 2018 IvanC - Sva prava pridržana -
Ova web domena/web stranica koristi cookie. Optimalna rezolucija 1280x1024, klikni za više
Zabranjeno je kopiranje, reproduciranje, prosljeđivanje i publiciranje cijelog sadržaja ili bilo kojeg njegova dijela (isto se odnosi na forum)