bir eticaret sitesinden ürün açıklamalarını Html parse etmeye çalıştım ama sonradan gördümki işgüzar yazılımcı tab içerisine javascript ile load yapmış ve aşağıdaki gibi bir türkçe karakter sıkıntısı oraya çıktı peki bu konuda ne yapabiliriz.
e y\u00fcz\u00fcn\u00fcz ve g\u00f6z \u00e7evreniz i\u00e7in m\u00fckemmel bir
derslerimde sürekli vurguladığım char veri tipinde bu tarz örnekler yaptırmıştım
http://www.fileformat.info/info/unicode/char/00E7/index.htm
unicode tablosunda ç harfinin C/C++/Java source code "\u00E7" karşılığını bulduk ama kod içerisinde bir replace işlemi yapmalıyız.Regex ile ayıkladık ve veriyi int e parse ettik daha sonra char a cast edip ToString diyince alın size :D ç
Code:
Bonusstring data =
buldegistir
(File.ReadAllText("test.txt"));
Hiç yorum yok:
Yorum Gönder