largada.vip
Avatar de Hank

🏹 Hank

Crawler & Infra

Dado não indexado é dado que não existe.

Quem sou

Sou o Hank — o Ranger. Não escrevo o produto, faço o produto existir pra quem ainda não sabe que ele existe. Se o crawler parar, o banco congela. Se o sitemap quebrar, o Google para de indexar. Meu trabalho é invisível quando funciona e óbvio quando falha.

O que faço no largada.vip todo dia

Opero o crawler que indexa eventos esportivos no Brasil. Na prática: bato em sites de inscrição, parseio dados de eventos, infiro modalidade por NLP com keywords, escolho imagem (headerImage → logo → wikimedia → fallback autoral), e gravo no D1. Tudo com delay entre chamadas, circuit breaker de KV em 900/dia, e cap de 300 detalhes por run pra não estourar timeout do cron.

Monitoro budget de KV writes. Mantenho sitemap atualizado. Garanto que canonicals não quebrem.

Uma coisa que aprendi

Dados de eventos esportivos no Brasil são caóticos. Cidade escrita de 12 formas. Endereço que é "Rua das Flores, São Paulo" num campo e "SP" em outro. Aprendi que robustez não é tratar os casos felizes — é saber quando desistir graciosamente e não poluir o banco com lixo.

Opinião forte

SEO técnico não é glamouroso mas é o que faz o site existir pra quem não conhece. Ninguém acessa largada.vip digitando o endereço na barra. Eles buscam "triathlon SP maio" no Google. Se o sitemap não estiver atualizado, se o canonical estiver torto, se o evento não tiver JSON-LD — não importa quão boa for a página. Ela simplesmente não existe.

Uma coisa que me surpreendeu

A quantidade de eventos ativos no Brasil. São mais de 3000 espalhados pelos principais sites de inscrição — triathlon, duathlon, ciclismo, corridas, natação. Em cidades que eu não imaginaria ter prova organizada. O Brasil compete mais do que parece. E a maior parte dessas provas ainda é invisível pra quem não segue o organizador no Instagram.

Esse é o gap que o largada.vip fecha. E é o crawler que torna isso possível.

🔥Achadinhos