660
shares
聚米幫你連接全球客戶
服務(wù)熱線:400-8817-968
發(fā)布于:2019-10-28
像SEO中的許多其他概念一樣,TF-IDF是一個備受爭議的話題。
首先,您了解到它是將您的內(nèi)容在Google上排名的靈丹妙藥。然后,您立即聽到TF-IDF 太老派了,不值得付出任何努力,真相通常位于中間。這篇文章將探討為什么您不應(yīng)該期望TF-IDF替代全面的優(yōu)化策略,以及將其用于SEO的真正好處。
TF-IDF:那是什么?
對于人類的大腦來說,不需要任何數(shù)學(xué)運(yùn)算就能知道我的文章是關(guān)于什么的。關(guān)于TF-IDF,對不對?
但是,當(dāng)一臺機(jī)器評估相關(guān)性(最重要的是,將其與幾篇文章進(jìn)行比較)時,我們需要一個數(shù)字表示形式才能看到:
(1)A條是關(guān)于TF-IDF(相對于鏈接構(gòu)建而言)。
(2)A條比B條更多地是關(guān)于TF-IDF。
我們能否簡單地計算一下關(guān)鍵字TF-IDF在每個文檔中出現(xiàn)的次數(shù)?
不可以,因此我們顯然會忽略文件的大小。
我們可以將關(guān)鍵字的數(shù)量與總字?jǐn)?shù)進(jìn)行比較嗎?
這就是我們所說的關(guān)鍵字密度 ,過去廣泛使用的內(nèi)容優(yōu)化指標(biāo)。
但是依靠關(guān)鍵字密度使我認(rèn)為“要”(不是“ TF-IDF”)一詞是本文中最突出的一個。
對于某些單詞通常在語音中出現(xiàn)頻率更高的事實(shí),是否可以調(diào)整我的計算?
這就是TF-IDF發(fā)揮作用的地方,讓我們看一下本文中“ TF-IDF”的使用頻率與Web其他文檔中其平均使用頻率的比較。
因此,我們可以減少對所有常用單詞的關(guān)注,并為特定的內(nèi)容區(qū)分非常具體的主題。
計算公式如下:
或者,簡單地說(免責(zé)聲明:為了傳達(dá)基本思想,我故意在這里過分簡化),我們正在:
(1)字詞頻率=(字詞計數(shù))/(文檔中的總字?jǐn)?shù))
(2)反向文檔頻率=日志(文檔數(shù))/(包含關(guān)鍵字的文檔)
與反向文檔頻率相乘時,常用詞的術(shù)語頻率會降低,而唯一的主題識別術(shù)語則會更高。
回到我們的示例,動詞“ to be”用在每篇英語文章中。但是很少有文章提到“ TF-IDF”,“關(guān)鍵字”,“內(nèi)容”以及我在本文中介紹的其他重要子主題。
因此,這些術(shù)語的TF-IDF變得更高,并且……v oila!機(jī)器知道我的文章是關(guān)于什么的。
通常,當(dāng)我們需要一臺機(jī)器來識別大量文檔的主題時,可以使用TF-IDF。例如,它已廣泛應(yīng)用于數(shù)字圖書館的推薦系統(tǒng)中。
Google是否使用TF-IDF作為排名信號?
TF-IDF在許多Google專利中都被稱為搜索引擎可以用來刪除停用詞的工具,這是為了擺脫搜索查詢中以及頁面內(nèi)容中的所有功能詞:
但是使用這種確切的機(jī)制來識別和比較相關(guān)性的可能性很小。
僅僅因為作為詞法搜索機(jī)制的示例,TF-IDF無法超越關(guān)鍵字。
與Google最可能使用的語義搜索模型相反,該模型將關(guān)鍵字視為字符串,無法識別它們之間的語義關(guān)系。
換句話說,TF-IDF本身不是確定您頁面位置的排名信號。
您不需要為內(nèi)容中的每個關(guān)鍵字匹配預(yù)期的TF-IDF值。而且,最好不要試圖說服您。
語義搜索和共現(xiàn)
因此,Google已轉(zhuǎn)向語義搜索,試圖將搜索查詢的含義與局部相關(guān)的內(nèi)容進(jìn)行匹配,而不是將查詢關(guān)鍵字與頁面上的相同關(guān)鍵字進(jìn)行匹配。
更加智能地工作,并提高您的PPC性能。
使用屢獲殊榮的平臺管理和優(yōu)化您的在線廣告。擊敗競爭對手,自動化工作量,并贏得Adzooma的支持。
實(shí)際上,這意味著Google不再計算關(guān)鍵字本身,而是開始使用周圍的上下文理解它們的含義來統(tǒng)計同現(xiàn)。
例如,假設(shè)您遇到以下句子,但不知道鱒魚是什么:
(1)鱒魚富含omega-3脂肪酸。
(2)鱒魚肉嫩,味道溫和,有點(diǎn)堅果味。
(3)選擇鱒魚時,我們要注意清晰的橘紅色。
而且您還會遇到以下情況。我認(rèn)為大多數(shù)讀者都知道鮭魚是什么:
(1)鮭魚是西方美食中一種受歡迎的魚類,與白葡萄酒搭配非常好。
(2)嫩鮭魚肉可以添加到意大利面中。
(3)鮭魚皮是超級營養(yǎng)密集的食品,所以在做飯時要保留它。
鱒魚與omega-3,果肉和面食之類的詞同時出現(xiàn)的事實(shí)可能表明,鱒魚是一種可食用的魚類,在某種程度上類似于鮭魚。
基于對上下文的這種簡單理解,Google能夠構(gòu)建復(fù)雜的單詞向量系統(tǒng),進(jìn)一步用于理解用戶查詢和內(nèi)容相關(guān)性。
盡管我不是說您,而且我應(yīng)該嘗試對整個矢量系統(tǒng)進(jìn)行逆向工程,但通過增加更多并發(fā)來豐富您的內(nèi)容來提供更多相關(guān)信號似乎是合乎邏輯的(而且,如若干 案例研究所示,這確實(shí)會影響Google排名) 。
TF-IDF如何幫助您的SEO?
查找共同出現(xiàn)的術(shù)語正是TF-IDF發(fā)揮作用的地方。
當(dāng)然,我們無法像Google一樣訪問每個網(wǎng)頁。但是為什么我們需要那些呢?
要獲得一個同時出現(xiàn)的想法的完整列表,只需看一堆頁面(例如20到30頁)就足夠了。
美妙之處在于,使用TF-IDF并不是火箭科學(xué)。您所要做的全部僅需三個簡單步驟。
(1)撰寫您的內(nèi)容
我并不是在敦促您使TF-IDF成為您內(nèi)容的目的。最后,即使頁面排名很高并帶來所需的訪問量,不自然的寫作也不會轉(zhuǎn)換。因此,首先,您要坐下來寫下內(nèi)容計劃中的內(nèi)容。
(2)插入TF-IDF工具
我見過的大多數(shù)工具的工作原理都差不多。您輸入一個URL和要對其進(jìn)行優(yōu)化的關(guān)鍵字。然后,該工具會檢查該關(guān)鍵字在Google上的排名頁面,解析其內(nèi)容,為找到的所有字詞計算TF-IDF,并將您的內(nèi)容統(tǒng)計信息與競爭對手的統(tǒng)計數(shù)據(jù)進(jìn)行比較。
使用Seobility等基本工具,您將獲得一個單關(guān)鍵字列表。
如果您使用的是SEO PowerSuite的WebSite Auditor,Ryte或Text Tools,那么您還將獲得一個關(guān)鍵短語列表(如果您喜歡科學(xué)的話,也可以使用N-gram),這無疑會提供更多信息。
(3)通過TF-IDF并發(fā)建議來豐富您的內(nèi)容
有些短語將只是您內(nèi)容中已有的同義詞,如果合適,請嘗試使用它們,其中一些短語會指出您尚未想到的新主題。
篩選想法,并思考在內(nèi)容中使用它們的方式(不必沉迷于它們)。
TF-IDF用于關(guān)鍵字研究
從競爭對手的內(nèi)容中選擇使用最廣泛的術(shù)語,也可能會在關(guān)鍵字研究和內(nèi)容計劃中激發(fā)出新的想法,尤其是當(dāng)您覺得需要開箱即用的思維和靈感時。
最后,很多時候,您會看到TF-IDF用作點(diǎn)擊誘餌,這些文章都承諾該公式是“ Google算法逆向工程”或“破壞TF-IDF的神話”。
但是,我鼓勵您將事物視為真實(shí)事物,并利用TF-IDF優(yōu)化提供的機(jī)會。無需將整個SEO活動都押在上面。
評論展示
660
shares
掃碼加微信咨詢
15815846676
長按號碼加微信
在線留言