Quantcast
Channel: Python Hispano
Viewing all articles
Browse latest Browse all 180

python majibu: Extracción de texto plano de una web con Python. ¿Cómo?

$
0
0

Hola a todos:

Llevo un tiempo intentando encontrar la forma de poder bajar una pagina web desde un programa, con wget es bastante fácil y con las librerías urllib también se puede conseguir en Python pero no encuentro la forma de conseguir que sólo se baje el texto de la página.

En síntesis, mi objetivo es conseguir un pequeño programa al que poder pasarle una url y que me devuelva todo el texto que esa página contiene, como si nos fuéramos al navegado e hiciéramos: botón derecho, seleccionar todo, copiar.

También he estado probando con los navegadores por terminal pero en algunos foros, blogs y periódicos digitales no muestra el contenido de forma correcta.

Alguien sabe como poder realizar esto en Python? Seguro que hay algo que esto pasando por algo. Agredecería cualquier aporte.

Un saludo enorme y gracias a todos !


Viewing all articles
Browse latest Browse all 180