תוכן כפול , ספאם וכל השאר

ספאם במנועי חיפוש או כל ניסיונות מרמה אחרות אשר מכוון להוליך שולל את מנוע החיפוש לתוך אתרים שחוזרים על עצמם בצורה בלתי הולמת ומיותרת. פעמים רבות התנהגות זו היא לראות דפים שבהם המלל מצויין בצורה מדויקת באופן כפול.   אנשים רבים מניחים כי יצירת עותקים מרובים או מראה דומה של אותו הדף, יהיה להגדיל את הסיכוי שמתמשים יגיעו לאתר דרך מנועי החיפוש בשל הימצאותם של מילות מפתח נוספות.

כדי לבצע חיפוש רלוונטי יותר למשתמש , מנועי חיפוש משתמשים במסנן אשר תפקידו הוא להסיר את התוכן הכפול ותוכן הזבל בדפי תוצאות החיפוש. למרבה הצער בונה אתרים רבים עלו על שיטה כיצד לרמות את המסננים שהוטלו על ידי מנועי חיפוש להסיר את התוכן הכפול.

כדי לדעת אם מנוע החיפוש רואה את התוכן כמשוכפל או לא , יש לדעת מספר דברים עיקריים:

1.       אתרים בעלי תוכן דפים זהה – אתרים אלו נחשבים כפולים והם נחשבים כדפי ספאם. אתרים שותפים עם אותו המראה והתחושה המכילים תוכן זהה, למשל, הם פגיעים במיוחד ממסנן התוכן המשוכפל.

2.       תוכן מגורד – תוכן מגורד זה לקחת תוכן מאתר אינטרנט ולשנות את האתר על מנת שיראה שונה לגמר, אך המהות היא לא יותר מאשר שכפול הדף. עם הפופולריות של בלוגים באינטרנט ועל סינדיקציה של אותם בלוגים, גרידה נהיה יותר בעיה עבור מסנן הכפילויות של מנועי חיפוש.

3.       כפילויות במוצרים במסחר אלקטרוני – אתרים רבים משתמשים באותו שם של היצרן ,ובאותו תיאור לגבי המוצרים! החנויות אשר נמצאות באותם שווקים תחרותיים ולכן תוכן זה כפול, בעת שקשה יותר למסנן למצוא את הכפילויות,ולכן הוא עדיין נחשב ספאם.

4.       הפצת מאמרים – אם אתה מפרסם מאמר ואתרים שונים מצאו בו כשימושי ומעתיקים אותו , זה טוב, נכון? לא בהכרח עבור מנוע החיפוש כל אתר הוא בפני עצמו , ולכן אתה יכול להיות נפגע בשל כפילות של המאמר ,למרות שאתה זה שרשמתה אותו במשך מספר ימים! סוג זה של תוכן כפול יכול להיות ערמומי, כי למרות שחלק ממנועי החיפוש אכן יכולים לקבוע את מקור המאמר , ישנם כאילו שלא ,לדוגמא גוגל העולמית!

אז, איך מנוע חיפוש מוצא כפילויות ומסנן את תוכן האתר?

  בעיקרון, כאשר הרובוט של מנוע החיפוש זוחל לאתר, הוא קורא את הדפים, ומאחסן את המידע על הנתונים. אחר כך, הוא משווה את הממצאים על כל מידע אחר שיש לו. בהתאם למספר הגורמים, כגון רלוונטיות הניקוד הכללי של אותו אתר, לאחר מכן הוא רשאי לקבוע שהם בעלי תוכן כפולים ולאחר מכן מסנן את הדפים או אתרי אינטרנט אשר מזכות כדואר זבל. למרבה הצער, אם הדפים הם לא זבל, אבל יש מספיק תוכן דומה, הן עדיין עשויות להיראות כדואר זבל.

כלי מצויין לבדיקה של תוכן משוכפל או אתר משוכפל  www.copyscape.com (בשפה האנגלית בלבד) אשר מחפש עותקים זהים של הדף שלך באינטרנט. זה יכול לעזור לך בכדי למצוא האם נפגעת מכפילות מסויימת או שהתוכן שלך אכן ייחודי.