Słownik pojęć marketingowych
Duplicate Content, zduplikowana treść – co to jest, definicja
Co to są kopie treści? Jak mogą wpłynąć na pozycje strony? Jak znaleźć duplicate content?
Duplicate content, kopie treści – definicja
Zjawisko duplikacji treści, czyli Duplicate Content polega na powieleniu tej samej zawartości
w różnych miejscach.
Stanowi ono jeden z podstawowych błędów spotykanych na stronach internetowych, który ma negatywny wpływ na pozycjonowanie SEO. Zaprzecza to zasadzie unikalności, która mówi, że należy publikować materiały oryginalne i unikalne, by osiągać wysokie pozycje w rezultatach wyszukiwania Google. Jest dużym problemem w przypadku e- sklepów, gdzie w przypadku tysięcy produktów zachodzi duże ryzyko zduplikowania opisów.
Różne rodzaje duplikatów
Warto pamiętać, że Duplicate Content dotyczy nie tylko warstwy tekstowej, lecz również graficznej, czyli zdjęć i ich meta-opisów.
Kopie treści mogą pojawiać się przez błędy oprogramowania strony, które generują kilka wersji URL tego samego adresu.
- z prefiksem https:// oraz http://,
- z przedrostkiem www i bez niego,
- zakończone różnymi końcówkami (pl i com.pl).
Lub w ramach strony działa filtracja, która również generuje wiele adresów URL z tą samą treścią.
Przyczyn może być wiele i będą zależały od rodzaju oprogramowania strony. Najłatwiej przyczynę duplicate content znajdziemy szukając samych kopii treści. Wtedy widać czy kopie pojawiają się na filtracji, na różnych produktach czy może przez generowanie adresów z www i bez www.
Jak znaleźć duplicate content (kopie opisów)?
Jest kilka sposobów, poniżej przedstawiamy nasze dwa ulubione.
Pierwszy najprostszy polega na skopiowaniu fragmentu opisu – długości około 50 – 100 znaków . To znaczy nie kopiujemy całego paragrafu, a bardziej 1-2 zdania. Następnie w cudzysłowiu wklejamy go w wyszukiwarkę Google i klikamy wyszukaj.
W rezultacie otrzymamy wszystkie zaindeksowane podstrony, które zawierają dokładnie dany fragment treści wklejony w cudzysłowiu:
Idealny scenariusz to gdy jest jeden wynik, oznacza to że nie ma kopii.
Jeśli wyników jest więcej to musimy sprawdzić je bardziej szczegółowo – czy skopiowany jest akurat tylko ten fragment czy cała treść? Z tą pomocą znajdziemy kopie zarówno w ramach naszej strony jak i ewentualne kopie na zewnątrz.
Drugi sposób to użycie narzędzia copyscape. Działanie jest bardzo proste. Wklejamy adres URL podstrony, którą chcemy sprawdzić. W rezultacie dostaniemy wyniki wszystkich podstron, gdzie dana kopia występuje. Dodatkowo będzie zaznaczona procentowa kopia tzn. W jakim procencie cała treść jest skopiowana na innych podstronach.
Narzędzie Copyscape ma wersję darmową i płatną. W tej drugiej jesteśmy w stanie monitorować na bieżąco grupę adresów URL i otrzymywać komunikaty jeśli pojawią się nowe kopie. Dodatkowo również możemy w wersji płatnej sprawdzać większą ilość adresów URL. Płatna wersja tego narzędzia jest idealna dla właścicieli dużych stron, z dużą liczbą podstron. Z kolei właścicielom małych stron np. Firmowych czy lokalnych bez problemu wystarczy wersja bezpłatna.
Jak usunąć duplicate content?
Zanim przejdziemy do sposobów to wyjaśnijmy po co usuwamy duplicate content. Nie chcemy, aby w indeksie Google pojawiały się kopie opisów.
Mamy cztery główne sposoby na usunięcie duplicate content:
1. Fizyczne usunięcie całej podstrony z kopią
Widzimy, że została utworzona niepotrzebna podstrona zawierająca kopie i ją fizycznie usuwamy.
2. Pozostawienie podstrony z kopią, ale przepisanie treści na nowo tak by była unikalna
Przykładowo mamy dwie osobne podstrony produktów z tej samej serii, które mają ten sam opis. Chcemy pozostawić obie podstrony w sklepie. W takim przypadku na jednej z nich piszemy tekst od nowa tak by był unikalny.
3. Pozostawienie podstrony ale jej wyindeksowanie z pomocą noindex
Podstrona zawiera kopie, ale nie chcemy jej usuwać bo np. Pełni ważną funkcję (jest to podstrona filtracji czy tagów). Wtedy ustawiamy na niej atrybut noindex, który będzie informacją dla robota by jej nie indeksować.
4. Pozostawienie podstrony ale ustawienie canonical na główną podstronę z daną treścią
Jak wyżej czyli podstrona zawiera kopie, ale nie chcemy jej usuwać bo np. Pełni ważną funkcję (jest to podstrona filtracji czy tagów). Na przykład mamy podstronę kategorii oraz wiele kopii filtrów na bazie tej kategorii. Możemy ustawić canonical wskazujący robotowi, że oryginał treści jest na głównej podstronie tej kategorii.
Oczywiście są jeszcze możliwe wspomniane problemy techniczne generujące wiele różnych wersji z www i bez www, ale to już szczegółowa opcja.
Co w przypadku dużych sklepów z tysiącami produktów z opisami od producentów?
Zdarzają się sklepy z dużym asortymentem, które mają tysiące produktów z opisami od producentów. Te opisy są oczywiście powielone na innych sklepach z tym asortymentem, które również opublikowały opisy producenta. Tworzy to oczywiście kopie i spory problem duplikacji w całym sklepie.
Idealne rozwiązanie problemu to napisanie tych opisów od nowa, tak by były unikalne. Jest to jednak często spora inwestycja. Dlatego w takich przypadkach trzeba indywidualnie ocenić co będzie najlepszym rozwiązaniem. Sklep nadal może osiągać dobre pozycje nawet jeśli ma część kopii.
W takich przypadkach jak wyżej opisane pośrednie rozwiązania to:
1. Zainwestowanie w opisy kategorii, w treści blogowe i inne.
Nadal na produktach są kopie, ale staramy się by w sklepie pojawiły się jakieś unikalne opisy. Tym samym chcemy procentowo zmniejszyć udział kopii w całości sklepu.
2. Dodanie unikalnych fragmentów do istniejących kopii na produktach.
Pozostawiamy istniejące kopie ale uzupełniamy je o unikalne fragmenty opisów jak pytania i odpowiedzi czy komentarze/opinie kupujących.
Co jeśli konkurencja kopiuje moje opisy?
Problem który pojawia się szczególnie przy opisach fachowych, wymagających dużych nakładów finansowych (plus znalezienie specjalisty w temacie). Aby utrudnić proceder kopiowania można zrobić te dwie rzeczy:
Zamieścić na końcu opisu notkę prawną informującą o konsekwencjach
Po dodaniu opisu zrobić screen z pomocą http://web.archive.org/. Służy ona do archiwizowania internetu.
Następnie jeśli widzimy że ktoś skopiował opis to sięgamy po pomoc prawną. Jako argument mamy nasz screen strony udowadniający, że dodaliśmy pierwsi dany opis.
Co jeśli skopiowany jest tylko fragment opisu?
Jeśli to jest procentowo mały udział w całości, na przykład 10 czy 20% treści na danej podstronie to kopia z innej podstrony to nie jest to problem.
Największy problem przy kopiach treści to sytuacje kiedy 80-100% treści z danej podstrony ma kopie na innych lokalizacjach.
Czy mogę zostawić część kopii i dopisać unikalny fragment?
Tak. Nie jest to idealne rozwiązanie problemu kopii treści, ale jak wspomnieliśmy wyżej, są sytuacje kiedy nie można wszędzie napisać unikalnych treści od nowa. Wtedy rozwiązaniem jest dodanie fragmentów oryginalnej treści co obniży procent kopii w ramach danej podstrony.
Można dodać np. Opinie użytkowników, sekcję pytań i odpowiedzi lub sekcję z dodatkowymi informacjami.
Co jest w indeksie Google a co poza nim
W przypadku kopii patrzymy przede wszystkim na to czy dane kopie są w indeksie i na jakich podstronach. Przykład:
Widzimy że na naszej stronie jest 5 podstron z tą samą treścią – kategoria i filtracje tej kategorii. Są to kopie. Sprawdzamy jednak co jest w indeksie Google. Jeśli jest tylko podstrona samej kategorii, bez filtrów, to znaczy że wszystko jest w porządku i nie ma problemu z kopiami.
Zwracamy na to uwagę, bo zdarzają się przypadki właścicieli stron, którzy walczą z każdą kopią którą znajdą na stronie. A tak naprawdę problem jest z grupą podstron, które się indeksują i to na nich są kopie do usunięcia.
-
a
- Autouzupełnianie Google, czyli co to?
- Autoresponder, czyli co to?
- Automatyczne tagowanie, czyli co to?
- Automatyczne odnawianie, czyli co to?
- Auto-Generated Content, czyli co to?
- Audiomarketing, czyli co to?
- Audience Network, czyli co to?
- Atrybut Target, czyli co to?
- Atrybut noreferrer, czyli co to?
- Atrybut noopener, czyli co to?
- Atrybut href, czyli co to?
- Atrybucja konwersji, czyli co to?
- Atrybucja, czyli co to?
- Asystent Google, czyli co to?
- ASP, czyli co to?
- Artykuł sponsorowany, czyli co to?
- Aromamarketing, czyli co to?
- API (Application Programming Interface), czyli co to?
- Answer box, czyli co to?
- Angażujące treści, czyli co to?
- Analiza zawartości, czyli co to?
- Analiza Space – co to jest, definicja
- Analiza konkurencji – co to jest, definicja
- Analityka internetowa – co to jest, definicja
- AMP (Accelerated Mobile Pages) – co to jest, definicja
- Ambush Marketing – co to jest, definicja
- Ambient Marketing – co to jest, definicja
- Amazon – co to jest, definicja
- Allow – co to jest, definicja
- Allegro – co to jest, definicja
- Algorytm A9 – co to jest, definicja
- Aktualność strony – co to jest, definicja
- Aktualizacje algorytmu Google – co to jest, definicja
- AJAX – co to jest, definicja
- AIDA – co to jest, definicja
- AI – co to jest, definicja
- Ahrefs Rank – co to jest, definicja
- Ahrefs – co to jest, definicja
- Agile – co to jest, definicja
- Agencja SEO – co to jest, definicja
- Above the fold – co to jest, definicja
- ABM – co to jest, definicja
- Audyt UX – co to jest, definicja
- Audyt strony www – optymalizacja SEO – co to jest, definicja
- Atrybut dofollow – co to jest, definicja
- Atrybut alt – co to jest, definicja
- Artykuł sponsorowany – co to jest, definicja
- Architektura informacji – co to jest, definicja
- Anchor Text – Kotwica linku
- Algorytm Google – co to jest, definicja
-
b
- Błąd 509, czyli co to?
- Błąd 503, czyli co to?
- Błąd 502, czyli co to?
- Błąd 501, czyli co to?
- Błąd 410, czyli co to?
- Błąd 405, czyli co to?
- Błąd 402, czyli co to?
- Błąd 401, czyli co to?
- Błąd 400, czyli co to?
- Błąd 303, czyli co to?
- Błąd 102, czyli co to?
- Błąd 101, czyli co to?
- Blokowanie indeksowania, czyli co to?
- Bloger, czyli kto to?
- Blog firmowy, czyli co to?
- Bingbot, czyli co to?
- Bing Webmaster Tools, czyli co to?
- Bing, czyli co to?
- Bezwzględny adres URL, czyli co to?
- BERT, czyli co to?
- Baza danych, czyli co to?
- Barter, czyli co to?
- Barnacle SEO, czyli co to?
- Bait and Switch, czyli co to?
- Baidu, czyli co to?
- Badanie potrzeb użytkowników, czyli co to?
- Backlog, czyli co to?
- B2C, czyli co to?
- B2B, czyli co to?
- Buzz Marketing – co to jest, definicja
- Buyer persona – co to jest, definicja
- Brief – co to jest, definicja
- Breadcrumbs – co to jest, definicja
- Branding – co to jest, definicja
- Bounce Rate – co to jest, definicja
- Bot – co to jest, definicja
- Blog – co to jest, jak założyć
- Błąd 500 – co to jest, definicja
- Błąd 404 – co to jest, definicja
- Błąd 403 – co to jest, definicja
- Black Hat SEO – co to jest, definicja
- Bing – co to jest, definicja
- Baner reklamowy – co to jest, definicja
- Ban od Google – co to jest, definicja
-
c
- Czynniki rankingowe, czyli co to?
- Częstotliwość indeksowania, czyli co to?
- CSR, czyli co to?
- Crowdsourcing, czyli co to?
- Crowdfunding, czyli co to?
- Cross-selling, czyli co to?
- Cross-linking, czyli co to?
- CRO (Conversion Rate Optimization – Optymalizacja Konwersji), czyli co to?
- CPC (Cost Per Click), czyli co to?
- CPA – Cost per Action, czyli co to?
- Corporate Governance, czyli co to?
- Core Web Vitals (Podstawowe Wskaźniki Internetowe), czyli co to?
- Cookies, czyli co to?
- Context Marketing, czyli co to?
- Content Spinning, czyli co to?
- Content Pruning, czyli co to?
- Content Gap, czyli co to?
- Content, czyli co to?
- Co-Branding, czyli co to?
- CLV (Customer Lifetime Value), czyli co to?
- CLS (Cumulative Layout Shift), czyli co to?
- Clickbait, czyli co to?
- Click fraud, czyli co to?
- Citation Flow, czyli co to?
- Churn and Burn SEO, czyli co to?
- Chunky middle keywords, czyli co to?
- Chatbot Marketing, czyli co to?
- Chat GPT, czyli co to?
- Chat Bot, czyli co to?
- Certyfikat SSL, czyli co to?
- Certyfikat EV, czyli co to?
- Certyfikat DV, czyli co to?
- Cele Google Analytics, czyli co to?
- Case Study (Studium przypadku), czyli co to?
- Captcha, czyli co to?
- Capping, czyli co to?
- Canva, czyli co to?
- CAC (Customer Acquisition Cost), czyli co to?
- CTR (ang. Click-through-rate – Współczynnik klikalności) – co to jest, definicja
- CTA (ang. Call to Action – Wezwanie do działania) – co to jest, definicja
- CSS (ang. Cascading Style Sheets – Kaskadowe Arkusze Stylów) – co to jest, definicja
- Crawler – co to jest, definicja
- CR (ang. Conversion Rate) – co to jest, definicja
- Copywriting – co to jest, definicja
- Content marketing (marketing treści) – co to jest, definicja
- CMS (ang. Content Management System – System zarządzania treścią) – co to jest, definicja
- Cloaking – co to jest, definicja
- CDN – co to jest, definicja
- CcTLD – co to jest, definicja
- Canonical – co to jest, definicja
-
d
- Dywersyfikacja linków, czyli co to?
- Dynamiczna treść, czyli co to?
- Dwell Time, czyli co to?
- DuckDuckGo, czyli co to?
- DTD (Document Type Definition), czyli co to?
- Drupal, czyli co to?
- Dropshipping, czyli co to?
- Double Opt-in, czyli co to?
- Dostosowanie stawek, czyli co to?
- Dostępność cyfrowa, czyli co to?
- Dopasowanie ścisłe, czyli co to?
- Dopasowanie do wyrażenia, czyli co to?
- Domena linkująca, czyli co to?
- Docelowy CPA, czyli co to?
- DNS, czyli co to?
- Disavow Tool, czyli co to?
- Disallow, czyli co to?
- Direct Admin, czyli co to?
- Digitalizacja, czyli co to?
- Digital Marketing, czyli co to?
- Depozycjonowanie, czyli co to?
- Deindeksowanie, czyli co to?
- Deep Link, czyli co to?
- Dead End Page, czyli co to?
- Data Driven Marketing, czyli co to?
- Dark Post, czyli co to?
- Dane strukturalne, czyli co to?
- Działania ręczne Google – co to jest, definicja
- Dynamic content (dynamiczna treść) – co to jest, definicja
- Duplicate Content, zduplikowana treść – co to jest, definicja
- DSA (ang. Dynamic Search Ads) – co to jest, definicja
- Dopasowanie przybliżone – co to jest, definicja
- Doorway page – co to jest, definicja
- Domain authority – co to jest, definicja
- Domain age – co to jest, definicja
- Disavow – co to jest, definicja
- Depozycjonowanie – co to jest, definicja
- Data Center – co to jest, definicja
- Dane strukturalne – co to jest, definicja
- Long tail (długi ogon) – co to jest, definicja
-
e
- Expiring domain, czyli co to?
- Evergreen Content, czyli co to?
- Event Marketing, czyli co to?
- Etapy indeksowania, czyli co to?
- ESG, czyli co to?
- Employer Branding, czyli co to?
- Email marketing, czyli co to?
- Element Title, czyli co to?
- Efektywność osobista, czyli co to?
- Efekty działań marketingowych, czyli co to?
- eCPC, czyli co to?
- Ebook, czyli co to?
- EAT, czyli co to?
- E-commerce-Grocery CPC, czyli co to?
- External links – co to jest, definicja
- Exact match anchor – co to jest, definicja
- Ecommerce – co to jest, definicja
- E-mail marketing – co to jest
-
f
- Freelancer, czyli kto to?
- Frazy informacyjne, czyli co to?
- Fraza, czyli co to?
- Framework, czyli co to?
- Frame, czyli co to?
- FLoC, czyli co to?
- Flash, czyli co to?
- First Contentful Paint (FCP), czyli co to?
- Firefox, czyli co to?
- Firebase, czyli co to?
- Filtr Google, czyli co to?
- FID, czyli co to?
- Feedback, czyli co to?
- Feed Produktowy, czyli co to?
- Featured snippet, czyli co to?
- FCP, czyli co to?
- Favicon, czyli co to?
- Fat head keywords, czyli co to?
- FAQ, czyli co to?
- Fanpage, czyli co to?
- Fałszywe strony przekierowujące, czyli co to?
- Facebook Attribution, czyli co to?
- Facebook, czyli co to?
- FTP – co to jest, definicja
- Fresh site bonus – co to jest, definicja
- Frazy kluczowe – co to jest, definicja
- Footer link – co to jest, definicja
- Filtr ręczny – co to jest, definicja
- Filtr algorytmiczny – co to jest, definicja
- Farmy linków – co to jest, definicja
-
g
- Guest posting, czyli co to?
- Guest blogging, czyli co to?
- Guerilla Marketing, czyli co to?
- GTMetrix, czyli co to?
- GTIN, czyli co to?
- GSP (Gmail Sponsored Promotion), czyli co to?
- Grywalizacja, czyli co to?
- Grupa dyskusyjna, czyli co to?
- Grupa docelowa, czyli co to?
- Growth Hacking, czyli co to?
- Grey Hat SEO, czyli co to?
- Greenwashing, czyli co to?
- Google sandbox effect, czyli co to?
- Google Partner Premier, czyli co to?
- Grafika wektorowa, czyli co to?
- Grafika rastrowa, czyli co to?
- Googlebot, czyli co to?
- Google Webmaster Tools, czyli co to?
- Google Trends, czyli co to?
- Google Tag Manager, czyli co to?
- Google Tag Assistant, czyli co to?
- Google Street View, czyli co to?
- Google Sites, czyli co to?
- Google Shopping, czyli co to?
- Google Search Console, czyli co to?
- Google Panda, czyli co to?
- Google News, czyli co to?
- Google Maps API, czyli co to?
- Google Looker Studio, czyli co to?
- Google Images, czyli co to?
- Google Essentials, czyli co to?
- Google Drive, czyli co to?
- Google Doodle, czyli co to?
- Google Discover, czyli co to?
- Google Data Studio, czyli co to?
- Google Dance, czyli co to?
- Google Chrome, czyli co to?
- Google Caffeine (Caffeine), czyli co to?
- Google Bowling, czyli co to?
- Google Bomb, czyli co to?
- Google Analytics 4, czyli co to?
- Google Analytics, czyli co to?
- Google Ads, czyli co to?
- Gołąb (Algorytm Gołąb), czyli co to?
- Ghostwriting, czyli co to?
- Geotargeting, czyli co to?
- Geotagging, czyli co to?
- Geolokalizacja, czyli co to?
- GDN, czyli co to?
- GTMetrics – co to jest, definicja