Stránka do txt...

Problémy s internetovými stránkami, internetovým prohlížečem atpod.

Moderátor: Mods_senior

Zamčeno
jeninicicek
nováček
Příspěvky: 7
Registrován: 07 zář 2015 21:12
Bydliště: Dolní Kounice

Stránka do txt...

Příspěvek od jeninicicek »

Nemáte někdo tip jak dostat jakoukoli stránku do txt, výsledné txt by mělo vypadat stejně jako, když stránku přes ctrl-a -c -v, vrazím do poznámkového bloku.
Zkoušel jsem nějaké html parsery, i projet html nějakým regulárním výrazem, ale prostě se mi pořád nedaří to vyčistit tak, jak přes ctrl-c -v.
Nechtěl bych na to nějakou aplikaci, ale spíš jak to řešit, kdybych si chtěl něco takového napsat... Jde to ctrl... nějak nasimulovat nebo tak něco bez otvírání stránek v prohlížeči?
Uživatelský avatar
faraon
Master Level 8.5
Master Level 8.5
Příspěvky: 7408
Registrován: 23 pro 2010 09:23

Re: Stránka do txt...

Příspěvek od faraon »

Co prostě vzít znak po znaku pouze obsah BODY, vyházet všechny tagy, a pouze reagovat na odstavce a odřádkování?
"Král Lávra má dlouhé oslí uši, král je ušatec!

(pravil K. H. Borovský o cenzuře internetu)
jeninicicek
nováček
Příspěvky: 7
Registrován: 07 zář 2015 21:12
Bydliště: Dolní Kounice

Re: Stránka do txt...

Příspěvek od jeninicicek »

Právě odfiltrovat vše, co se tam objeví je někdy problém(ne všichni píší stránky slušně :D), aneb jak píši parsery(např. jsoup) jsem zkoušel, ale nebyl jsem zrovna spokojen....
jeninicicek
nováček
Příspěvky: 7
Registrován: 07 zář 2015 21:12
Bydliště: Dolní Kounice

Re: Stránka do txt...

Příspěvek od jeninicicek »

No nic, nakonec se mi to kombinací několika řešní podařilo....
Zamčeno

Zpět na „Internet a internetové prohlížeče“