Jak zjistit všechny externí soubory v HTML dokumentu?   zodpovězená otázka

VB.NET

Zdravím,

můžete mi poradit, jak mohu z HTML dokumentu vytahat všechny odkazy na externí soubory tak, aby se vešlo například do jednoho cyklu? Já jsem to ošetřil tak, že procházím všechny obrázky, linky, skripty, ... a beru z nich hodnotu parametru "src" (resp. "href"). Ale je to zbytečně moc kódu a práce.

Děkuji

nahlásit spamnahlásit spam 0 odpovědětodpovědět

Pokud nepoužijete nějakou knihovnu na rozklad HTML, tak je toto jediné řešení.

Teoreticky by to šlo udělat přes XML parser, ale bohužel 90% html stránek nejsou XML validní.

nahlásit spamnahlásit spam 1 / 1 odpovědětodpovědět

Já to nepoužívám na klasické webové stránky, ale na dokumentu, který uživatel vizuálně edituje a kód ho validuje, je li třeba, takže tady problém nebude. Děkuji za nápad.

nahlásit spamnahlásit spam 0 odpovědětodpovědět

A pokud jde o čtení "špinavého" html, tak doporučuji knihovnu HTML Agility Pack (http://www.codeplex.com/htmlagilitypack/ )

nahlásit spamnahlásit spam 0 odpovědětodpovědět
                       
Nadpis:
Antispam: Komu se občas házejí perly?
Příspěvek bude publikován pod identitou   anonym.
  • Administrátoři si vyhrazují právo komentáře upravovat či mazat bez udání důvodu.
    Mazány budou zejména komentáře obsahující vulgarity nebo porušující pravidla publikování.
  • Pokud nejste zaregistrováni, Vaše IP adresa bude zveřejněna. Pokud s tímto nesouhlasíte, příspěvek neodesílejte.

přihlásit pomocí externího účtu

přihlásit pomocí jména a hesla

Uživatel:  
Heslo:  

zapomenuté heslo

 

založit nový uživatelský účet

zaregistrujte se

 
zavřít

Nahlásit spam

Opravdu chcete tento příspěvek nahlásit pro porušování pravidel fóra?

Nahlásit Zrušit

Chyba

zavřít

feedback