Duplicate content, kopie treści – definicja

Zjawisko duplikacji treści, czyli Duplicate Content polega na powieleniu tej samej zawartości
w różnych miejscach.

Stanowi ono jeden z podstawowych błędów spotykanych na stronach internetowych, który ma negatywny wpływ na pozycjonowanie SEO. Zaprzecza to zasadzie unikalności, która mówi, że należy publikować materiały oryginalne i unikalne, by osiągać wysokie pozycje w rezultatach wyszukiwania Google. Jest dużym problemem w przypadku e- sklepów, gdzie w przypadku tysięcy produktów zachodzi duże ryzyko zduplikowania opisów.

Różne rodzaje duplikatów

Warto pamiętać, że Duplicate Content dotyczy nie tylko warstwy tekstowej, lecz również graficznej, czyli zdjęć i ich meta-opisów.

Kopie treści mogą pojawiać się przez błędy oprogramowania strony, które generują kilka wersji URL tego samego adresu.

  • z prefiksem https:// oraz http://,
  • z przedrostkiem www i bez niego,
  • zakończone różnymi końcówkami (pl i com.pl).

Lub w ramach strony działa filtracja, która również generuje wiele adresów URL z tą samą treścią.

Przyczyn może być wiele i będą zależały od rodzaju oprogramowania strony. Najłatwiej przyczynę duplicate content znajdziemy szukając samych kopii treści. Wtedy widać czy kopie pojawiają się na filtracji, na różnych produktach czy może przez generowanie adresów z www i bez www.

Jak znaleźć duplicate content (kopie opisów)?

Jest kilka sposobów, poniżej przedstawiamy nasze dwa ulubione.

Pierwszy najprostszy polega na skopiowaniu fragmentu opisu – długości około 50 – 100 znaków . To znaczy nie kopiujemy całego paragrafu, a bardziej 1-2 zdania. Następnie w cudzysłowiu wklejamy go w wyszukiwarkę Google i klikamy wyszukaj.

W rezultacie otrzymamy wszystkie zaindeksowane podstrony, które zawierają dokładnie dany fragment treści wklejony w cudzysłowiu:

kopie treści

Idealny scenariusz to gdy jest jeden wynik, oznacza to że nie ma kopii.

Jeśli wyników jest więcej to musimy sprawdzić je bardziej szczegółowo – czy skopiowany jest akurat tylko ten fragment czy cała treść? Z tą pomocą znajdziemy kopie zarówno w ramach naszej strony jak i ewentualne kopie na zewnątrz.

Drugi sposób to użycie narzędzia copyscape. Działanie jest bardzo proste. Wklejamy adres URL podstrony, którą chcemy sprawdzić. W rezultacie dostaniemy wyniki wszystkich podstron, gdzie dana kopia występuje. Dodatkowo będzie zaznaczona procentowa kopia tzn. W jakim procencie cała treść jest skopiowana na innych podstronach.

Narzędzie Copyscape ma wersję darmową i płatną. W tej drugiej jesteśmy w stanie monitorować na bieżąco grupę adresów URL i otrzymywać komunikaty jeśli pojawią się nowe kopie. Dodatkowo również możemy w wersji płatnej sprawdzać większą ilość adresów URL. Płatna wersja tego narzędzia jest idealna dla właścicieli dużych stron, z dużą liczbą podstron. Z kolei właścicielom małych stron np. Firmowych czy lokalnych bez problemu wystarczy wersja bezpłatna.

Jak usunąć duplicate content?

Zanim przejdziemy do sposobów to wyjaśnijmy po co usuwamy duplicate content. Nie chcemy, aby w indeksie Google pojawiały się kopie opisów.

Mamy cztery główne sposoby na usunięcie duplicate content:

1. Fizyczne usunięcie całej podstrony z kopią

Widzimy, że została utworzona niepotrzebna podstrona zawierająca kopie i ją fizycznie usuwamy.

2. Pozostawienie podstrony z kopią, ale przepisanie treści na nowo tak by była unikalna

Przykładowo mamy dwie osobne podstrony produktów z tej samej serii, które mają ten sam opis. Chcemy pozostawić obie podstrony w sklepie. W takim przypadku na jednej z nich piszemy tekst od nowa tak by był unikalny.

3. Pozostawienie podstrony ale jej wyindeksowanie z pomocą noindex

Podstrona zawiera kopie, ale nie chcemy jej usuwać bo np. Pełni ważną funkcję (jest to podstrona filtracji czy tagów). Wtedy ustawiamy na niej atrybut noindex, który będzie informacją dla robota by jej nie indeksować.

4. Pozostawienie podstrony ale ustawienie canonical na główną podstronę z daną treścią

Jak wyżej czyli podstrona zawiera kopie, ale nie chcemy jej usuwać bo np. Pełni ważną funkcję (jest to podstrona filtracji czy tagów). Na przykład mamy podstronę kategorii oraz wiele kopii filtrów na bazie tej kategorii. Możemy ustawić canonical wskazujący robotowi, że oryginał treści jest na głównej podstronie tej kategorii.

Oczywiście są jeszcze możliwe wspomniane problemy techniczne generujące wiele różnych wersji z www i bez www, ale to już szczegółowa opcja.

Co w przypadku dużych sklepów z tysiącami produktów z opisami od producentów?

Zdarzają się sklepy z dużym asortymentem, które mają tysiące produktów z opisami od producentów. Te opisy są oczywiście powielone na innych sklepach z tym asortymentem, które również opublikowały opisy producenta. Tworzy to oczywiście kopie i spory problem duplikacji w całym sklepie.

Idealne rozwiązanie problemu to napisanie tych opisów od nowa, tak by były unikalne. Jest to jednak często spora inwestycja. Dlatego w takich przypadkach trzeba indywidualnie ocenić co będzie najlepszym rozwiązaniem. Sklep nadal może osiągać dobre pozycje nawet jeśli ma część kopii.

W takich przypadkach jak wyżej opisane pośrednie rozwiązania to:

1. Zainwestowanie w opisy kategorii, w treści blogowe i inne.

Nadal na produktach są kopie, ale staramy się by w sklepie pojawiły się jakieś unikalne opisy. Tym samym chcemy procentowo zmniejszyć udział kopii w całości sklepu.

2. Dodanie unikalnych fragmentów do istniejących kopii na produktach.

Pozostawiamy istniejące kopie ale uzupełniamy je o unikalne fragmenty opisów jak pytania i odpowiedzi czy komentarze/opinie kupujących.

Co jeśli konkurencja kopiuje moje opisy?

Problem który pojawia się szczególnie przy opisach fachowych, wymagających dużych nakładów finansowych (plus znalezienie specjalisty w temacie). Aby utrudnić proceder kopiowania można zrobić te dwie rzeczy:

Zamieścić na końcu opisu notkę prawną informującą o konsekwencjach

zakaz-kopiowania

Po dodaniu opisu zrobić screen z pomocą http://web.archive.org/. Służy ona do archiwizowania internetu.

Następnie jeśli widzimy że ktoś skopiował opis to sięgamy po pomoc prawną. Jako argument mamy nasz screen strony udowadniający, że dodaliśmy pierwsi dany opis.

Co jeśli skopiowany jest tylko fragment opisu?

Jeśli to jest procentowo mały udział w całości, na przykład 10 czy 20% treści na danej podstronie to kopia z innej podstrony to nie jest to problem.

Największy problem przy kopiach treści to sytuacje kiedy 80-100% treści z danej podstrony ma kopie na innych lokalizacjach.

Czy mogę zostawić część kopii i dopisać unikalny fragment?

Tak. Nie jest to idealne rozwiązanie problemu kopii treści, ale jak wspomnieliśmy wyżej, są sytuacje kiedy nie można wszędzie napisać unikalnych treści od nowa. Wtedy rozwiązaniem jest dodanie fragmentów oryginalnej treści co obniży procent kopii w ramach danej podstrony.

Można dodać np. Opinie użytkowników, sekcję pytań i odpowiedzi lub sekcję z dodatkowymi informacjami.

Co jest w indeksie Google a co poza nim

W przypadku kopii patrzymy przede wszystkim na to czy dane kopie są w indeksie i na jakich podstronach. Przykład:

Widzimy że na naszej stronie jest 5 podstron z tą samą treścią – kategoria i filtracje tej kategorii. Są to kopie. Sprawdzamy jednak co jest w indeksie Google. Jeśli jest tylko podstrona samej kategorii, bez filtrów, to znaczy że wszystko jest w porządku i nie ma problemu z kopiami.

Zwracamy na to uwagę, bo zdarzają się przypadki właścicieli stron, którzy walczą z każdą kopią którą znajdą na stronie. A tak naprawdę problem jest z grupą podstron, które się indeksują i to na nich są kopie do usunięcia.

A
B
C
D
E
F
G