Como criei um varredura diária de papers de IA com Ollama + Telegram

wpnews.pro

cd /news/artificial-intelligence/como-criei-um-varredura-diaria-de-pa… · home › topics › artificial-intelligence › article

[ARTICLE · art-15703] src=dev.to ↗ pub=2026-05-27T20:02Z topic=artificial-intelligence verified=true sentiment=↑ positive

Como criei um varredura diária de papers de IA com Ollama + Telegram

A developer built a daily AI paper scanner using Ollama and Telegram, automating the retrieval and translation of HuggingFace Papers into Portuguese. The Python script fetches the day's top papers via the HuggingFace API, sends each abstract to a local LLM through Ollama for translation, and delivers the results as formatted Telegram messages. The entire system runs locally without cloud dependencies or API costs, and can be replicated in under 10 minutes.

read3 min views8 publishedMay 27, 2026

Se você acompanha pesquisa em IA, sabe que o HuggingFace Papers solta novos papers todo dia. O problema? São dezenas de abstracts em inglês, e ler tudo manualmente é inviável no dia a dia.

Resolvi automatizar isso: um script Python que busca os papers do dia, joga cada abstract pro meu LLM local via Ollama, traduz pra português e manda tudo pro Telegram. Sem pagar por API, sem nada na nuvem.

Neste artigo vou te mostrar como funciona e como você pode replicar em menos de 10 minutos.

O resultado no Telegram fica assim:

🤖 HuggingFace Papers — 27/05/2026
Top 8 papers do dia, traduzidos com llama3
──────────────────────────────

1. *Scaling Laws for Reward Model Overoptimization*
👥 Leo Gao, John Schulman, Jacob Hilton
💬 142 upvotes

📝 Investigamos como o desempenho de modelos de linguagem muda quando otimizamos 
excessivamente contra um modelo de recompensa (reward model). Descobrimos que o 
desempenho no proxy aumenta mas o desempenho verdadeiro diminui — um fenômeno 
conhecido como overoptimization. Nossos experimentos mostram leis de escala 
previsíveis para esse comportamento...

🔗 HuggingFace | arXiv

llama3

(ou qualquer modelo que você tiver)

hf-digest/
├── hf_digest.py      # script principal
├── config.py         # suas configurações
└── get_chat_id.py    # helper para descobrir o chat_id

config.py

Começa pela configuração. Tudo em um lugar só, fácil de ajustar:

TELEGRAM_BOT_TOKEN = "SEU_TOKEN_AQUI"
TELEGRAM_CHAT_ID   = "SEU_CHAT_ID_AQUI"
OLLAMA_URL         = "http://localhost:11434"
OLLAMA_MODEL       = "llama3"
MAX_PAPERS         = 8

A API do HuggingFace retorna os papers do dia em JSON. Simples assim:

def fetch_papers() -> list[dict]:
    today = datetime.now().strftime("%Y-%m-%d")
    url = f"https://huggingface.co/api/daily_papers?date={today}"

    headers = {"User-Agent": "Mozilla/5.0 (compatible; HFDigestBot/1.0)"}
    response = requests.get(url, headers=headers, timeout=20)
    response.raise_for_status()

    papers = response.json()
    return papers[:MAX_PAPERS]

Aqui mora a mágica. O Ollama expõe uma API REST local no localhost:11434

. A gente manda um prompt e ele retorna a resposta do modelo:

def translate_with_ollama(text: str) -> str:
    prompt = f"""Você é um assistente especializado em IA e ML. 
Traduza e resuma o seguinte abstract para o português brasileiro.
Mantenha termos técnicos em inglês entre parênteses quando necessário.
Responda APENAS com o resumo, sem frases introdutórias.

Abstract:
{text}"""

    payload = {
        "model": OLLAMA_MODEL,
        "prompt": prompt,
        "stream": False,
    }

    response = requests.post(
        f"{OLLAMA_URL}/api/generate",
        json=payload,
        timeout=120,
    )
    return response.json()["response"].strip()

O stream: False

faz o Ollama esperar processar tudo antes de responder — mais fácil de lidar do que streaming para esse caso de uso.

O bot do Telegram aceita Markdown, então dá pra formatar bem as mensagens:

def send_telegram(text: str) -> bool:
    url = f"https://api.telegram.org/bot{TELEGRAM_BOT_TOKEN}/sendMessage"
    payload = {
        "chat_id": TELEGRAM_CHAT_ID,
        "text": text,
        "parse_mode": "Markdown",
        "disable_web_page_preview": True,
    }
    response = requests.post(url, json=payload, timeout=15)
    return response.ok

main()

def main():
    papers = fetch_papers()

    send_telegram(f"🤖 *HuggingFace Papers — {datetime.now().strftime('%d/%m/%Y')}*")

    for i, paper in enumerate(papers, start=1):
        abstract = paper["paper"].get("summary", "")

        translated = translate_with_ollama(abstract)
        message = format_paper(paper, i, translated)
        send_telegram(message)

    send_telegram(f"✅ {len(papers)} papers enviados!")

1. Instale a dependência

pip install requests

2. Crie o bot no Telegram

/newbot

, siga as instruçõesconfig.py

3. Descubra seu Chat ID

Envie qualquer mensagem pro seu novo bot e rode:

import requests
from config import TELEGRAM_BOT_TOKEN

r = requests.get(f"https://api.telegram.org/bot{TELEGRAM_BOT_TOKEN}/getUpdates")
updates = r.json()["result"]
chat_id = updates[-1]["message"]["chat"]["id"]
print(f"Seu chat_id: {chat_id}")

4. Suba o Ollama e rode

ollama serve
python3 hf_digest.py

Poderia ter usado a API da OpenAI ou do Gemini para traduzir. Mas há algumas vantagens em rodar local:

O llama3

faz um trabalho muito bom em traduções técnicas. Se quiser mais velocidade, o phi4

ou gemma3

também funcionam bem e são mais leves.

Para receber o digest todo dia de manhã sem precisar rodar manualmente, adicione ao crontab:

crontab -e
0 9 * * * cd /caminho/para/hf-digest && python3 hf_digest.py >> digest.log 2>&1

Algumas ideias para evoluir o projeto:

O projeto completo está disponível no GitHub: [ https://github.com/lromais/ai_newsletters]

Se você testar e fizer alguma melhoria, compartilha nos comentários! E se tiver dúvida em algum passo do setup, é só perguntar.

Tags: python, ai, ollama, telegram, machinelearning

source & further reading

dev.to — original article I Traced a Multi-Step LLM Agent With Self-Hosted SigNoz. One Feature Sold Me. How I Built a Fully Automated AI Blog with AWS CDK, Bedrock, and Step Functions The Missing Economic Layer: How AI Agents Will Pay for Their Own Infrastructure

~/api · this article 200

$curl api.wpnews.pro/v1/news/como-criei-um-varredura-…

Read original on dev.to → dev.to/lincoln_romais/-como-criei-um-varredura-d…

mentioned entities

HuggingFace

Ollama

Llama3

Leo Gao

John Schulman

Jacob Hilton

metadata

slugcomo-criei-um-varredura-diaria-de-papers-de-ia-com-ollama-telegram

topic#artificial-intelligence

secondary4 topics

sentimentpositive

canonicaldev.to

navigation

← prevInline Wikipedia for every artic…

next →Facebook launches a ‘Plus’ subsc…

── more in #artificial-intelligence 4 stories · sorted by recency

blog.stackademic.com · 11 Jul · #artificial-intelligence

I Have 10 Minutes to Train an AI Model. Here’s Exactly What Happened.

machinebrief.com · 11 Jul · #artificial-intelligence

ReRanking Preference Optimization: Aligning AI with Real Needs

github.com · 11 Jul · #artificial-intelligence

Hasharot – Control a Claude Code agent on your machine from Telegram

machinebrief.com · 11 Jul · #artificial-intelligence

Scaling AI Truth Detection: SOLiD's Promising Results

── more on @huggingface 3 stories trending now

wpnews · 30 May · #ai-safety

Nightcord Security Analysis Report - Threat Investigation

wpnews · 27 May · #artificial-intelligence

How I Run Two Claude Accounts as One

wpnews · 8 Jul · #artificial-intelligence

SpaceXAI unveils Grok 4.5 AI model ahead of July 2026 public release

sponsored brought to you by zahid.host 4,200+ EU-deployed projects

reading about agents? ship yours in a single git push.

Run your AI side-project on zahid.host

EU-based hosting, git-push deploys, automatic HTTPS, no cold starts. Free tier with a custom domain — perfect for shipping the agent you just read about.

$git push zahid main

→ Live at https://your-agent.zahid.host ✓

Get free account → Pricing

from €0/mo · no card required