Bunun üzerine Tidy uygulayarak geçersiz HTML ayrıştırmak için daha iyi bir yaklaşım var mı?
Side Note : There are some situation when you can't have Tidy available. Regexp is also not recommended I understood for parsing html.