本文的description和keywords字段內(nèi)容是指網(wǎng)頁<meta name="description">和<meta name="keywords">標簽的content屬性內(nèi)容,它們無法通過可視化窗口點選采集;
可通過以下方法配置解決(使用其中一個即可):
在簡數(shù)采集器的控制臺點擊 “+創(chuàng)建采集任務(wù)” 按鈕創(chuàng)建任務(wù),按智能向?qū)J讲僮鳎斍轫撘?guī)則器的description和keywords字段系統(tǒng)會自動配置好。
2. 在詳情提取器,左側(cè)“字段定義”-》“添加”,從下拉字段中選擇description或keywords即可。
若使用 “+創(chuàng)建任務(wù)(高級)” 創(chuàng)建的任務(wù),詳情頁規(guī)則器中無配置好的字段,需要用戶自定義配置;
或者用戶之前刪除了description和keywords字段,現(xiàn)需加回來;
這些場景可使用 “Xpath + 字段數(shù)據(jù)處理” 方法來解決:
點擊添加字段,并分別命名為description和keywords;
description字段的當前字段Xpath填上 //meta[@name="description"] (固定值,網(wǎng)頁通用);
keywords字段的當前字段Xpath填上 //meta[@name="keywords"] (固定值,網(wǎng)頁通用);
注意:填寫后記得點擊 “保存Xpath” 按鈕;
分別在description和keywords字段的字段數(shù)據(jù)處理 “高級配置” 選項卡中==》“提取值類型” 中選擇 “節(jié)點屬性(需填寫屬性名)”==》“屬性名” 中填寫content ;
注意:完成后記得點擊 “保存” 按鈕;