Como encontrar feed RSS de um site específico? Se existe alguma maneira particular de encontrá-lo?
Você pode encontrá-lo olhando a origem da home page (ou blog). Procure uma linha parecida com esta:
<link rel="alternate" type="application/rss+xml" title="RSS Feed" href="http://example.org/rss" />
O valor href será onde o RSS está localizado.
Existem várias maneiras de obter o feed RSS do site.
O que você pode fazer é obter a origem da página de um website e pesquisar por essa tag de link de type="application/rss+xml"
Isso conterá o feed RSS desse site, se houver.
Aqui está um programa simples em python que irá imprimir o feed RSS de qualquer site, se houver.
import requests
from bs4 import BeautifulSoup
def get_rss_feed(website_url):
if website_url is None:
print("URL should not be null")
else:
source_code = requests.get(website_url)
plain_text = source_code.text
soup = BeautifulSoup(plain_text)
for link in soup.find_all("link", {"type" : "application/rss+xml"}):
href = link.get('href')
print("RSS feed for " + website_url + "is -->" + str(href))
get_rss_feed("http://www.extremetech.com/")
Salve este arquivo com a extensão .py e execute-o. Ele vai te dar o url feed RSS do site.
O Google também fornece APIs para encontrar os feeds RSS de um site. Por favor, localize-os aqui: API do Google Feed
O menu Ferramentas do Firefox agora tem um comando "Informações da Página". Uma das guias dessa ferramenta exibe informações de feed descobertas.
Você precisa percorrer todos os URLs em seu site e, em seguida, encontrar um que contenha "rss".
O método acima talvez não funcione em alguns casos se url na tag href for algo como feed.xml , então nesse caso você precisará percorrer todas as tags contendo hrefErss, então apenas analise url do atributo href.
Se você quiser fazer isso através do navegador, pressione CTRL + U para ver a fonte, em seguida, CTRL + F para abrir a janela de localização e, em seguida, basta digitar rss . O URL do feed RSS deve aparecer imediatamente.