Quizás me he quedado muy atrás de la vida, pero prácticamente no uso las redes sociales, y prefiero recopilar información sobre actualizaciones de sitios de interés para mí a través de RSS. Pero no puedes deshacerte de las redes sociales en absoluto, algunas completamente cambiadas allí, lanzando sitios (bueno o canales rss en estos sitios).
Por lo tanto, necesitamos algún tipo de analizador que tome información de la página en la red social y la presente como un canal rss, que puedo dar a mi lector de RSS.
Durante algún tiempo utilicé
feed.exileed.com , pero no era una cosa muy estable, y recientemente prácticamente dejó de funcionar. Por lo tanto, pensé en reemplazar.
Encontré el servicio vkrss.com, pero casi simultáneamente vi un script php del mismo nombre:
https://github.com/woxcab/vkrss , que inmediatamente me obligó a dejar de buscar. Soy un amante de las soluciones autohospedadas, trato de confiar en servicios de terceros solo si es posible como reserva, y no como base.
Este script sabe bastante, para mí la mayor parte no es necesario. Pero tal vez alguien sea importante:
- Obtención de canales RSS de pared abierta: extracción de descripciones de diferentes partes (incluidos los archivos adjuntos) y construcción de encabezados basados en la descripción.
- También recibe fuentes RSS de un muro cerrado en presencia de un token con derechos de acceso sin conexión vinculados a un perfil que tiene acceso a dicho muro. A continuación se describe uno de los métodos para obtener un token.
- Obtener una fuente RSS que contenga publicaciones de varios muros abiertos que coincidan con una consulta de búsqueda global.
- Obtener un número arbitrario de registros del muro.
- Recibir publicaciones publicadas de cualquier persona, en nombre de la comunidad / propietario de la página, o de todos menos la comunidad / propietario de la página.
- Filtrar registros por presencia o ausencia de una firma.
- Filtre registros por coincidencia y / o falta de coincidencia en una expresión regular en el estilo PCRE.
- Opcionalmente, excluya publicaciones de la comunidad marcadas como anuncios [deshabilitado de forma predeterminada].
- Extraer etiquetas hash como categorías RSS.
- Opcionalmente, formato HTML de todo tipo de enlaces, imágenes, saltos de línea [habilitado por defecto].
- Puede usar HTTPS, SOCKS4, SOCKS4A o SOCKS5 proxies para las solicitudes.
- Cada entrada en el feed indica el autor (ya sea el que firmó o publicó el registro, o el que firmó o publicó el registro original, si el registro final es un reenvío del original).
- Posibilidad de establecer su propio separador con sustituciones entre registros primarios y secundarios (reposts).
Después de la muerte del lector de Google, leí
RSS a través de
Tiny Tiny RSS (no es la única opción, pero es bastante digna). Así que tengo mi propio servidor y agrego un analizador para VKontakte, no hay problema.
El único inconveniente es que este script requiere registro en vk.com para funcionar, sin esto no puede obtener un token de acceso incluso para leer páginas abiertas.
Solo para alimentar la paranoia, intenté crear una cuenta nueva, pero se rompió al ingresar el número de teléfono. Intenté varios sitios diferentes para recibir sms, pero ninguno apareció. Simplemente no llegué a algunos sms, a algunos vk.com me negué a enviarlos, "este número ya se ha utilizado" o "el número equivocado". No estoy diciendo que esto sea imposible, solo que lejos de ser simple. Será más confiable obtener una tarjeta SIM física que no esté vinculada a su personalidad. Sí, y probablemente más fácil.
Pero ya estoy registrado de todos modos, así que todo lo anterior fue solo entretenimiento.
Introductorio:Hay un servidor en Ubuntu 16.04.6 LTS donde funciona ttrss. Es necesario transmitir varias páginas desde el sitio vk.com allí.
Todas las páginas están abiertas, sin contraseñas, no leo ninguna página cerrada.
Instalación:Aquí todo es elemental: si no desea instalar git, descargue el
archivo del github y descomprímalo en algún lugar de la carpeta en el servidor web para que el navegador pueda acceder a él. Los requisitos del sistema son mínimos, solo tener php es suficiente.
PHP> = 5.2.2 (incluyendo 5.3.X, 5.4.X, 5.5.X, 5.6.X, 7.X) con las extensiones predeterminadas mbstring, json, pcre, openssl.
El script prefiere usar las capacidades integradas en PHP para enviar solicitudes. Si PHP ha deshabilitado la capacidad incorporada de descargar archivos por URL (el parámetro allow_url_fopen está deshabilitado en la configuración o los parámetros del intérprete), pero PHP tiene instalada la extensión cURL, entonces se usará para cargar datos.
Configuración:En
la página del programa, hay documentación bastante clara sobre todos los temas, porque aquí solo le contaré brevemente sobre mi tarea: leer las páginas públicas.
El enlace para obtener el feed rss debería verse así: index.php? Id = <page> & access_token = XXXXXXXXX
Digamos que queremos leer a
Habr . Entonces el enlace debería verse como index.php? Id = habr & access_token = XXXXXXXXX
Solo queda obtener un token para acceder. Para leer páginas abiertas, esto es elemental.
Cree una aplicación independiente :

Y luego, en la sección "Configuración", le interesa el campo "Clave de acceso al servicio":

Este será su acceso_token. Es decir, al final, nuestro enlace debería verse como
index.php? Id = habr & access_token = 5eb381185eb381185eb38118f95ed8e59455eb35eb3811803a40fe7530c290f98df6d0a . Bueno, sin olvidar, por supuesto, sustituir el nombre del servidor al principio. Después de abrir el enlace en el navegador, vemos una página adecuada para alimentar un lector RSS.

Para obtener instrucciones más detalladas, le aconsejo que vaya a la página del programa:
https://github.com/woxcab/vkrss#rus .