
圖片來源:圖蟲創(chuàng)意
上篇文章發(fā)布后,很多朋友在問能不能爬關(guān)鍵詞,話不多說,立馬安排。
不要在意文章格式,程序員不知道搞花里胡哨的文章樣式。記得點(diǎn)贊、評論、轉(zhuǎn)發(fā)獲得更多規(guī)則代碼!
先上上篇文章演示的規(guī)則代碼。
#獲取指定精確關(guān)鍵詞的競品數(shù)據(jù)(復(fù)制以下代碼導(dǎo)入到web scraper中即可)
圖片來源:乃超老師
圖片來源:乃超老師
(由于上傳格式問題,所以截圖方便大家觀看,需要原版請留言)
本文你將學(xué)到:
拿到亞馬遜對產(chǎn)品的識別詞
詞頻分析挑出最重要的關(guān)鍵詞
通過上述代碼,按昨天方式,直接爬取表格,爬出來之后是下面這樣的:
(圖片來源:亞馬遜平臺截圖)
通過上圖可以發(fā)現(xiàn),平臺識別詞是拿到了,但是并不好分析,好人做到底,簡單表格正則表達(dá)式處理方式也教個(gè)大家。
拆到干凈數(shù)據(jù),主要做5步
1. 替換 %2F 為 / ------> 為了兼容廣告超鏈接轉(zhuǎn)義問題
2. 替換 *&url=/ 為空 ------> 為了劃分廣告超鏈接中的識別詞
3. 替換 /dp/* 為空 ------> 拆分正常鏈接
4. 替換 https://www.amazon.com 為空 ---> 其他站點(diǎn)對應(yīng)替換
5. 替換 - 為 空格(記住是空格不是空)
不會(huì)換的參考下圖,Excel軟件點(diǎn)擊編輯再點(diǎn)切換
(圖片來源:乃超老師)
通過上述五步操作處理后就是如下圖的數(shù)據(jù),干干凈凈,清清楚楚,隨你玩。
(圖片來源:乃超老師)
比如放到詞頻工具中分析哪些詞或詞組用的比較多,如下圖:
(圖片來源:乃超老師)
碼字半小時(shí),純原創(chuàng)純干貨分享,持續(xù)關(guān)注持續(xù)分享。有額外需求的私下交流,能實(shí)現(xiàn)的盡量實(shí)現(xiàn),打完收工。
(來源:乃超老師)
以上內(nèi)容屬作者個(gè)人觀點(diǎn),不代表雨果跨境立場!本文經(jīng)原作者授權(quán)轉(zhuǎn)載,轉(zhuǎn)載需經(jīng)原作者授權(quán)同意。?