Banda Ancha EU

Comunidad de usuarios
de fibra, móvil y ADSL

hosting en interdominios
292 lecturas y 3 respuestas
  • [Editado]

    BandaAncha.eu + Rss + Calibre = Ebook for Ereaders. (He programado esta receta para Leer las news y Articulos en los ereaders,

    BandaAncha.eu + Rss + Calibre = Ebook de news for Ereaders. by KRorschachZ

    El sistema funciona como sigue:

    Usando CALIBRE software, se crea una RECETA del portal, se puede usar los RSS, pero tambien permite crear ebooks de paginas sin RSS, es algo mas dificil y estamos en ello, pues es en lenguaje python:

    una pista: calibre-ebook.com/user_manual/news.html

    Luego, se va al programa y se inserta este codigo:

    #!/usr/bin/env python
    # vim:fileencoding=UTF-8:ts=4:sw=4:sta:et:sts=4:ai
    from calibre.web.feeds.news import re
    class BandaAnchaNews(BasicNewsRecipe):
     title = u'BandaAncha News'
     timefmt = ' [%d %b, %Y]'
     __author__ = 'KRorschachZ'
     description = 'Noticias Banda Ancha ISP´s & Tecnología'    # indicando en las dos variables siguientes 15-77, tarda 12 minutos
     # en codificar el ebook. mas completo. evidentemente
    
     oldest_article = 7
     max_articles_per_feed = 44
     use_embedded_content = False
     publisher = 'BA'
     category = 'Noticias Banda Ancha ISP´s & Tecnología'
     language = 'es_ES'
     publication_type = 'newsportal'
     remove_javascript = True
     extra_css = ' .txt_articulo{ font-family: sans-serif; font-size: medium; text-align: justify } .contentheading{font-family: serif; font-size: large; font-weight: bold; color: #000000; text-align: center}'
     feeds = [(u'BandaAncha News', u'http://feeds.feedburner.com/bandaanchaeu')]

    luego vamos a Descarga noticias:

    (vemos la personalizada...) y luego el proceso de descarga de los articulos, gestionados por fecha, tambien se puede limitar el numero de comentarios de salida, aunque algunos SON interesantes, ;-) (le lleva un rato, tal vez me pasé con los limites, pero si ven el codigo, eso se puede bajar facil, con los lectores electronicos es facil, cuando ya estamos en comentarios, podemos saltar con una tecla al Indice, o al articulo siguiente, por tanto, ¿para que quitarlos?...

    (bueno, hay una version "mas de libro", de la receta, PARA los puristas de los ereaders)

    class AdvancedUserRecipe1288742903(BasicNewsRecipe):
     title = u'BandaAnchaOnlyNEWS'
     oldest_article = 12
     max_articles_per_feed = 77
    
     feeds = [(u'BandaAnchaOnlyNEWS', u'http://feeds.feedburner.com/bandaanchaeu')]

    (He programado esta receta para Leer las news y Articulos en los ereaders, pero, tal vez pueden echarme un cable con los RSS, (no veo las imagenes en cada articulo, y quedaría aun mejor con la imagen de cada uno).

    Ahora bien, la pagina de RSS no parece "contener" las imagenes de entrada en cada articulo, ¿confirmación?...

    feeds.feedburner.com/bandaanchaeu

    Y tal vez sea posible crear una receta mas compleja, basandose en las diferentes secciones; o un RSS mas completito... asi es más sencillo de exportar a distintos dispositivos.

    Les animo a intentarlo, es mas potente de lo que parece, el Calibre se puede programar para que visite BA cada cierto tiempo y los ficheros personalizar en buen detalle. (Hay recetas de paginas muy complejas, de agencias de noticias, que no siempre tienen el RSS en buen estado, el de BandaAncha no esta mal del todo, pero sería interesante tener un RSS "personalizado" a la seccion de ARTICULOS:

    bandaancha.eu/articulos

    Pues no todos acaban en portada... ;-)

    Bien, el caso es que el fichero de salida, formateado por calibre al gusto del ereader del consumidor, es enviado automaticamente por USB, wifi si procede, o hasta por mail... depende...

    Anexo: el fichero generado *.mobi con variables en 15-77 ocupa 3Mb... y hay 24 articulos y bastantes entradas por articulo, tarda 10~12 minutos en codificarse en un Dual Core a 3 Ghz... (se descartan articulos por fechas en auto, etc)

    Probando con 7-22, tarda 4~5 minutos, que pueden ser 2 o 3 en un Procesador tipico de hoy en dia...

    En la version MODE libro "purista", llegan los ultimos 9 articulos y solo 700 kb... de carga, practicamente perfecto...

    Bueno, si alguien se anima a mejorar lo presente, el propio Calibre tiene un VISOR del documento final...

    salu2.

    PD: si os gusta como queda se lo podemos enviar a es posible que "pongan la receta" en el programa de serie en la siguiente versión, suelen añadirse novedades de ese tipo, pero para eso puede ser necesario optimizarla un poco...

    (Creo que si entramos a modo avanzado, perdemos el canal "modo basico" y entonces la captura de calibre es muy detallada, es posible que nos podemos quedar con las imagenes, que en este modo si salen, pero recortando parte de los accesorios, links y spam..., mejorando la navegacion en 6"...)

    uhmm. aqui dejamos la TERCERA version de la RECETA por ahora, en la que salen todas las imagenes tipicas, se ve de cine en un kindle DX, y los articulos con opcion a saltar en los links, a la fuente, la diferencia con respecto al primero es que se carga "los comentarios", pero deja datos de horas, autor de la noticia y links habituales, digamos que es una opcion intermedia, aunque la version basica basta y sobra, pues el autor se ve en "el indice de articulos", tal vez seria posible insertar "un breve texto" de antetitulo en el RSS, para que salga alli mismo tambien... "como los periodicos"... debajo de cada titulo...)

    #!/usr/bin/env python
    
    # vim:fileencoding=UTF-8:ts=4:sw=4:sta:et:sts=4:ai
    
    from calibre.web.feeds.news import re
    
    class BandaAnchaNews(BasicNewsRecipe):
    
     title  = u'BandaAncha News'
    
     timefmt = ' [%d %b, %Y]'
    
     __author__ = 'KRorschachZ'
    
     description = 'Noticias Banda Ancha ISP´s & Tecnología'
    
     # indicando en las dos variables siguientes 15-77, tarda 12 minutos
     # en codificar el ebook. mas completo. evidentemente
    
     oldest_article = 7
     max_articles_per_feed = 55
    
     use_embedded_content = False
    
     publisher = 'BA'
    
     category = 'Noticias Banda Ancha ISP´s & Tecnología'
    
     language = 'es_ES'
    
     publication_type = 'newsportal'
    
     remove_javascript = True
    
     extra_css = ' .txt_articulo{ font-family: sans-serif; font-size: medium; text-align: justify } .contentheading{font-family: serif; font-size: large; font-weight: bold; color: #000000; text-align: center}'
    
     remove_tags = [
      dict(name=['object','link','script','ul','iframe','ol'])
     ,dict(name='span', attrs={'class':['article-section']})
     ,dict(name='span', attrs={'class':['content_rating']})
      ,dict(name='span', attrs={'class':['content_vote']})
     ,dict(name='span', attrs={'class':['createby']})
     ,dict(name='div', attrs={'class':['dialog']})
     ,dict(name='div', attrs={'id':['jcWrapper']})
     ,dict(name='div', attrs={'class':['buttonheading']})
     ,dict(name='div', attrs={'class':['authordetails']})
     ,dict(name='table', attrs={'class':['pagenav']})
     ,dict(name='div', attrs={'id':['jc_commentFormDiv']})
     ]
    
     remove_tags_after = dict(name='div', attrs={'id':'sidebar'})
    
     feeds = [(u'BandaAncha News', u'http://feeds.feedburner.com/bandaanchaeu')]

    Ale, vamos con las capturas reales del lector con Etinta... ;-)

    Las 13 primeras imagenes definen como se ve "a escala REAL", el ebook de BandaAncha, utilizando solo RSS, sin coments, articulos y texto en estado puro:

    1 2

    En la imagen superior se echa en falta "una breve" descripción al estilo de esto:

    (ven el titulo en negrita y luego la cursiva...)

    3 4 5

    6 7 8

    9 10 11 12 13

    Las 7 siguientes definen una receta en la que entra "el formato" bastante parecido a la web, pero sin comentarios, aunque con links e imagenes, digamos que un termino intermedio de detalle, (bueno, sobran algunos links, pero... aceptable)

    1 2

    (se echa en falta algo mas de texto, debajo de cada titulo...)

    3 4

    5 6 7

    Y estas ultimas copian cada articulo con sus comentarios y formateados según se ven en la pagina... (si se cambian las fuentes del ereder, cabe mas texto, etc...), es un *.mobi, pero podria ser un awz, tal vez hasta un epub, aunque igual no formatea igual en ese caso...

    1

    2 3

    4 5 6 7

    ---------------

    Bien, quien dice esta www, dice cualquier otra, bueno, Espero que les guste el "invento"...

    Saludos, buenas noches, y dulces sueños.

    code: 3MBytes, con zoom.

    Este tema lleva más de 6 meses inactivo. Es recomendable que abras un nuevo tema para retomar la conversación.
    • En seccion de Articulos Enviados, ( a la tercera versión):…

      En seccion de Articulos Enviados, ( a la tercera versión):

      RSS + Conexion BandaAncha + Calibre + Ereaders = Ebooks website news. by KRorschachZ

      Bueno, por aqui tenemos un análisis más completo, la entrada de este articulo va del tema: ebooks, RSS y Web 2.0... ¿como combinar todo esto?, con un poco de software, paciencia y una conexion decente...

      Seguro que muchas veces se han preguntado como "usar" y "como gastar" su conexion de Banda Ancha sin tener que recurrir al manido p2p, o largas navegaciones con el tiempo pegado al asiento, ¿nunca tiene la sensación de que delante de un ordenador, hace un viaje en el tiempo?, un viaje al futuro para ser exactos, "desaparecen" 1 o 2 o 3 horas sin enterarse, da igual, navegando, youtubeando, picando código, googleando, mailings, etc...; bueno, pues aqui un posible uso:

      La idea es que el Software Calibre tiene un apartado "para descargar" news, (recetas), estas se convierten en "prácticamente cualquier formato de ereaders", desde Kindle´s hasta Ipads, pasando por los raros Iliad, y todos esos que se venden en España, pasen por Libranda, AQUI; , describen casi todos, excepto los que acabo de citar, y son decenas, no se si llegaran a los 100 ereaders ya en el mercado ¡¡¡.

      Mediante una receta de este tipo:

      class AdvancedUserRecipe1288742903(BasicNewsRecipe):
       title = u'BandaAnchaOnlyNEWS'
       oldest_article = 12
       max_articles_per_feed = 77
      
       feeds = [(u'BandaAnchaOnlyNEWS', u'http://feeds.feedburner.com/bandaanchaeu')]

      Que se crea prácticamente automatizada desde esta pantalla:

      tenemos Los articulos que nosotros, ustedes, o ellos, decidan en un Ebook¡, a leer en Tinta Electronica y "SIN" interferencias visuales, simplemente casi perfecto.

      El sistema tiene mas virtudes, como es el proceso de automatizacion de Calibre, y envío "ultrafast" al Lector Electrónico.

      Pueden ustedes crear una "lista de news", de webs, de blogs, y todas las mañanitas el sistema se arranca, se conecta a internet y DESCARGA todas esas paginas. Y aqui viene la parte interesante, mientras dura ese proceso con varios procesos abiertos consumiendo grandes cantidades de procesador (codigo en pythom, todo no podian ser ventajas), se usa de forma "masiva" la conexion de Banda Ancha... y se usa bien, pega unos buenos "picotazos" de caudal y cuando mejor es la conexion, "mas" rapido se revisan centenares de paginas Html y se descartan los articulos, links y spam, por fechas. Evidentemente antes de descartarlo hay que leerlo y eso lleva un proceso.

      En las pruebas realizadas, eso puede llevar unos cuantos minutos en una conexion de fibra y "algo" mas tiempo en una conexion de ADSL, son muchas conexiones simultaneas, pero no deja de ser navegación, SIMPLEMENTE navegacion.

      * Acabado el proceso, el fichero se envía al Lector electrónico, cualquier de ellos, los formatos soportados son multiples y variados, se puede ajustar practicamente de todo y tenemos algo asi:

      8 Articulos, en 700 kbytes. O bien 18 si se amplian las fechas:

      En tamaño real, disculpen pero "reducir" esa imagen es meter mucho "escalado", esta capturado del lector y son 1200 px y una definicon de 160 dpi... el doble que un periódico de papel. En lectores de 6", la nitidez aun es mayor... Vamos al tema...:

      Los Articulos permiten cambiar las fuentes, el tamaño de letra, decimos, el margen lateral, etc...

      Así de bien se lee:

      etc...

      Tambien se puede leer en formato "web", si elegimos otra receta:

      O incluso con los links de las secciones:

      Ventajas, lectura en cualquier lugar, LECTURA REAL, (lectura de verdad), automatizacion de la navegación, uso de las tecnologias 2.0, resguardo de los articulos interesantes en un fichero ebook, actualizacion automatica a las ultimas novedades e incorporaciones...

      Y todo ello GLP, GNU y en blanco y negro. Al mas puro estilo "retro", "sano", "directo", "real"...

      El futuro de la lectura ya esta aquí, pero también el de la navegación, el de adaptación a las condiciones del lector, y no al revés como hasta ahora, el lector decide CUANDO, COMO y DONDE lee la prensa, revistas, los árticulos y cuando visita sus paginas favoritas, (bueno, las visita el software y siempre a la misma hora)..., el PC deja de ser el único dispositivo que "nos" mantiene informados y conectados al mundo... El futuro se se llama eReader y yotengo UNO.

      saludos, buenos Dias y Buena Suerte.

    • Creacion de ebook del blog de Xataka con el sistema propuesto…

      Creacion de ebook del blog de Xataka con el sistema propuesto aqui:

      Usando el software calibre se puede crear un libro electronico del blog, al estilo de news americano:

      Queda muy bien, buen trabajo con el RSS en Xakata.

      "He tardado 27 segundos en crear el libro, incluida la receta"

      ;-)

      PD: queda asi:

      (en la segunda img, se ve un "indice de articulos" más descriptivo)

      salu2

      www
      Textos con © del autor, bajo licencia GNU-GPL v3.