"robots.txt", arama motorlarına web sitenizdeki belirli içeriği tarayıp tarayamayacaklarını belirten bir metin dosyasıdır. Bu dosya, web sitenizin kök dizininde bulunur ve arama motorlarına hangi sayfaların indekslenmesine izin verildiğini veya engellendiğini belirtir. robots.txt dosyası, özellikle arama motoru botlarının (örneğin Googlebot) web sitenizi ziyaret ettiğinde hangi sayfaları tarayabileceklerini belirlemek için kullanılır.
Bir robots.txt dosyası, aşağıdaki temel yapıya sahiptir:
Disallow: [İzin verilmeyen URL yolları veya '*' (tüm sayfalar)]
Allow: [İzin verilen URL yolları]
İşte birkaç örnek robots.txt dosyası:
- Tüm arama motorlarına tam erişim sağlanacak şekilde:
Disallow:
Bu örnekte, tüm arama motorlarına ("*") tam erişim sağlanmıştır.
- Tüm arama motorlarına tam erişim sağlanacak, ancak /gizli/ dizini hariç:
Disallow: /gizli/
Bu örnekte, tüm arama motorlarına ("*") tam erişim sağlanmıştır, ancak /gizli/ dizini hariçtir.
- Sadece Googlebot'a tam erişim sağlanacak:
Disallow:
Bu örnekte, sadece Googlebot'a tam erişim sağlanmıştır.
- Tüm arama motorlarına tam erişim sağlanacak, ancak /gizli/ dizini hariç ve /yonlendirme.html dosyası engellenecek:
Disallow: /gizli/
Disallow: /yonlendirme.html
Bu örnekte, tüm arama motorlarına ("*") tam erişim sağlanmıştır, ancak /gizli/ dizini hariçtir ve /yonlendirme.html dosyası engellenmiştir.
robots.txt dosyasını oluştururken, arama motoru botlarının sitenizi nasıl tarayabileceğini ve indeksleyebileceğini dikkate almalısınız. Örneğin, gizli veya özel içerikleri engellemek için Disallow yönergesini kullanabilirsiniz. Ancak, bu dosyanın doğru bir şekilde yapılandırılması ve güncellenmesi önemlidir, aksi takdirde istenmeyen sonuçlara neden olabilir.