AIO, GEO și AEO: ce sunt și cum le aplici
AIO, GEO și AEO sunt trei direcții de optimizare care apar tot mai des atunci când vrei ca pagina ta…
Citește articolul
Dacă ai ajuns aici, probabil ai văzut că tot mai multe site-uri au început să publice un fișier numit llms.txt și te întrebi dacă chiar trebuie să-l configurezi sau e încă unul dintre acele „standarde” pe care le promovează câțiva entuziaști pe LinkedIn. Răspunsul scurt: depinde ce vrei să obții. Mai jos îți explic ce face, ce nu face, și cum se leagă de robots.txt – care, apropo, n-a dispărut și nici nu va dispărea.
llms.txt este un fișier text pe care îl pui în rădăcina site-ului (la example.com/llms.txt) și care le spune modelelor AI cum să înțeleagă structura conținutului tău. E gândit ca un fel de „hartă curată” pentru LLM-uri – ChatGPT, Claude, Perplexity, Gemini și restul – care altfel ar trebui să scaneze HTML plin de meniuri, popup-uri, scripturi și alte gunoaie.
Diferența față de sitemap.xml: sitemap-ul spune motoarelor de căutare ce pagini există. llms.txt spune modelelor AI care e conținutul important și în ce ordine să-l citească, ideal în format Markdown.
Propunerea vine de la Jeremy Howard (Answer.AI) și a fost lansată în septembrie 2024. Nu e un standard oficial W3C. Nu e obligatoriu. Și – asta e important – niciun AI major nu a confirmat public că îl folosește activ pentru training sau pentru răspunsuri. Asta nu înseamnă că e inutil, dar e bine să știi de la început în ce te bagi.
robots.txt există din 1994. E un fișier prin care comunici cu crawler-ele web: Googlebot, Bingbot, plus zecile de boți AI care au apărut în ultimii 2 ani (GPTBot, ClaudeBot, PerplexityBot, Google-Extended, CCBot, etc.).
Ce poate face robots.txt:
Ce NU poate face robots.txt:
Exemplu practic de robots.txt pentru cineva care vrea să blocheze AI-ul de la training, dar să permită crawling normal:
User-agent: GPTBot
Disallow: /
User-agent: Google-Extended
Disallow: /
User-agent: CCBot
Disallow: /
User-agent: *
Allow: /
Atenție: dacă blochezi Google-Extended, conținutul tău nu va fi folosit pentru training-ul Gemini, dar va fi în continuare indexat normal de Google Search. Sunt lucruri diferite.
Structura e simplă. Fișierul e Markdown, salvat ca llms.txt, urcat în rădăcina domeniului.
Schelet minim:
# Numele site-ului
> Descriere scurtă (1-2 propoziții) despre ce e site-ul.
## Secțiune principală
– [Titlu pagină](https://example.com/pagina): scurtă descriere
– [Altă pagină](https://example.com/altă-pagină): scurtă descriere
## Resurse opționale
– [Blog](https://example.com/blog): articole despre X
Ce trebuie să incluzi realist:
Ce să eviți:
Unele site-uri publică și un llms-full.txt care conține conținutul complet al paginilor importante, nu doar linkuri. E util pentru documentație tehnică sau pentru SaaS-uri care vor ca modelele AI să „învețe” exact ce face produsul lor.
Realist, pentru un site de business obișnuit (servicii, e-commerce, blog), llms.txt simplu e suficient. llms-full.txt are sens dacă ai documentație tehnică serioasă – gen Stripe, Anthropic, Mintlify.
Sincer? E greu de verificat direct. Câteva metode practice:
Pentru robots.txt, verificarea e mai simplă: Google Search Console îți arată exact ce blochează Googlebot. Pentru boții AI, te bazezi pe log-uri și pe regulile pe care le-ai scris corect.
Dacă ai timp limitat și vrei să fii pregătit pentru „search-ul AI” (care nu e încă majoritar, dar crește):
Punctul 4 e cel pe care îl subestimează cei mai mulți. LLM-urile învață din conținut public agregat. Dacă brandul tău apare doar pe site-ul propriu, ai vizibilitate zero în răspunsurile AI. Dacă apari în 30-50 de publicații relevante, șansele cresc semnificativ.
llms.txt e un fișier opțional, ușor de implementat, cu beneficii încă neclare dar potențial mari pe termen lung. Robots.txt rămâne fișierul prin care controlezi efectiv cine accesează site-ul. Configurează-le pe amândouă, dar nu te aștepta la miracole. Conținutul bun și autoritatea externă încă fac diferența – acolo ar trebui să-ți pui banii.
Creezi contul în câteva minute, alegi prima publicație și vezi cum funcționează procesul real. Fără abonament, fără volum minim, fără să te legi de nimic.