Texte WDF*IDF optimieren

What the f*** is WDF*IDF?

… oder – wie man Texte mit Hilfe von WDF*IDF optimieren kann

WDF*IDF – wer sich ein wenig mit SEO auskennt, wird das sicher schon mal gehört haben. Und wer sich zusätzlich mit guten Content beschäftigt, der MUSS das kennen ;-). WDF*IDF ist für den Tod der Keyword-Density (Keyworddichte) verantwortlich. Halt, das stimmt nicht ganz: Karl Kratz ist für den Tod der Keyword-Density verantwortlich, denn er ist der Schöpfer dieser kleinen Formel. Sie ist inzwischen schon ein paar Jahre alt und hat sich seither bewährt. Dennoch ist diese Formel weder der Stein der Weisen noch der heilige Gral – sie ist ein Indikator für die Qualität von Texten in Bezug auf bestimmte Keywords.

Aber was genau ist denn nun WDF? Und was zum Henker macht IDF?

Okidoki – um das genau zu erklären, muss ich zunächst ein paar Begriffe erläutern:

Zunächst der Begriff „Termfrequenz„. Die Termfrequenz ist die Häufigkeit, mit der ein bestimmter Term (also ein bestimmtes Wort) in einem Dokument vorkommt. Diesen Wert kann man messen, ersagt zuhächst allerdings wenig über das Dokument bzw. den Text aus. Taucht z.B. das Wort „Hundefutter“ in einem 3.000 Worte langen Text 4 x auf, so ist dieser Text dennoch nicht relevant für den Begriff „Hundefutter“. Taucht „Hundefutter“ aber in einem nur 20 Worte umfassenden Text 2 x auf, so ist „Hundefutter“ in diesem Text deutlich relevanter, obwohl es 1 x weniger vorkommt, als im langen Text.

Und nun noch die „Keyword-Density“ oder „Keyworddichte“. Die Keyworddichte beschreibt die Häufigkeit, mit der ein Wort in einem Dokument vorkommt im Verhältnis zur Gesamtzahl aller Begriffe des Dokuments. Die Formel zur Berechnung der Keyworddichte lautet also: Häufigkeit des Begriffs*100/Anzahl aller Worte im Dokument.
Die früher angestrebte Keyworddichte lag bei 3-7%. Man konnte diese also einfach dadurch erreichen, dass man das Keyword öfter im Dokument verwendet hat. Das funktioniert heute nicht mehr. Warum das so ist und warum das auch gut so ist, erfahrt ihr nun:

Na endlich – das ist WDF*IDF:

WDF heißt „Within Document Frequency“ und bedeutet, dass die Termfrequenz (also die Häufigkeit, mit der ein Term im Text auftaucht) in das Verhältnis zur Gesamtzahl aller im Dokument enthaltenen Terme gesetzt wird. Die Formel zur WDF-Berechnung erspare ich euch. Wichtig ist zu wissen, dass hier mit einem Logarithmus gerechnet wird (eigentlich sogar mit zweien), um einen realistischeren Wert zu erhalten (damit wird bewirkt, dass die Relevanz eines Textes nicht einfach durch Verwendung endlos vieler Worte gesteigert werden kann).

WDF ist somit eigentlich die Keyworddichte in Kombination mit einem Logarithmus.

Die WDF wird bei einer Analyse für JEDES Wort des Textes errechnet. Dadurch erhält man eine Gewichtung – welcher Begriff ist der stärkste des Dokuments, welcher der zweitstärkste, usw. Damit wird euer Text sozusagen geröntgt und ihr könnt genau sehen, wofür euer Text eigentlich steht.

Jetzt könnt ihr natürlich gleich einwerfen, dass dann ja jeder Text für Wörter wie „und“, „oder“, etc. ranken müsste. Grundsätzlich richtig, aber solche Füll- und Stopwörter werden bei der WDF*IDF-Berechnung nicht berücksichtigt. Und zwar wegen IDF 🙂

Was soll das mit dem „IDF“ eigentlich?

IDF = die „Inverse Document Frequency„. Das bedeutet, dass nun die Wertigkeit der einzelnen Begriffe in das Verhältnis zu allen anderen Dokumenten im Internet gesetzt werden. Huh, das ist Groß! 🙂 Der Gedanke dabei ist folgender: Begriffe, die in nahezu jedem anderen Dokument im Internet zu finden sind, beinhalten nur wenig Relevanz. Damit wären Füll- und Stopworte raus.

Natürlich weiß niemand, wie viele Dokumente es im Internet gibt. Und genauso kann niemand sagen, wie viele Dokumente es im Internet gibt, die Relevanz für einen bestimmten Begriff besitzen. Und letztlich müssten wir sogar wissen, wie viele Dokumente im Internet existieren, die diesen Begriff enthalten, ohne relevant dafür zu sein, denn auch diese sollten mit in die Berechnung einbezogen werden. Deshalb sind alle Werte, die irgendwelche Tools liefern, als Näherungswerte zu verstehen. Sie sind natürlich nicht wissenschaftlich exakt berechnet, geben aber sehr gute Anhaltspunkte, wie der eigene Text zu bewerten ist.

WDF*IDF bedeutet also, die Begriffe, die im eigenen Dokument vorkommen ins Verhältnis mit allen anderen Dokumenten im Internet zu setzen, die für die gleichen Begriffe Relevanz besitzen bzw. diese enthalten.
So, dann legt mal los mit der Berechnung… B-)
Nein, müsst ihr nicht – dafür gibt es natürlich Tools, die das für euch erledigen.
WDF*IDF Analyse
Hier habe ich z.B. mit OnPage eine Seite, die für den Begriff „Hundefutter“ ziemlich gut rankt, für „Hundefutter“ analysieren lassen. Die rote Linie sind die Werte der analysierten Seite, die Balken die Werte der TOP10 bei Google. Und hier lässt sich schön erkennen, dass die Seite ganz gute Relevanz für Hundefutter, Trockenfutter, Nassfutter und Platinum (eine Hundefutter-Marke) besitzt, aber auch für viele ähnlich wichtige Begriffe kaum bzw. keine Relevanz hat. So sollte, wer über Hundefutter schreibt, auch über Josera, Farrado und Fütterungsempfehlungen schreiben.

Was ihr nun NICHT tun solltet

Bitte versucht nicht, nur noch WDF*IDF-optimierte Texte zu schreiben. Wenn der Text krampfig wird, ist das sehr schlecht. Zudem behaltet immer im Hinterkopf, dass WDF*IDF nicht alles ist. Die Formel macht Sinn bei größeren Webseiten. Shopdetailseiten mit wenig Text bringen auch kein vernünftiges WDF*IDF-Ergebnis. Und die Formel berücksichtigt z.B. keine Keywordverteilung (d.h. WO stehen die Keywords im Text – das ist für Google z.B. nicht ganz unwichtig), es werden keine Synonyme berücksichtigt etc.
Schreibt eure Texte so, dass sie für den User einen Mehr- und einen Unterhaltungswert bieten. Wenn ihr dann ein WDF*IDF-Tool drüber laufen lasst, ist das sicher kein Fehler – aber schreibt keine völlig durchoptimierten SEO-Texte – die will kein Mensch lesen 😉
0 Kommentare

Dein Kommentar

Want to join the discussion?
Feel free to contribute!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.