<button id="g80sy"></button>
  • <abbr id="g80sy"></abbr>
  • <button id="g80sy"></button>
    <rt id="g80sy"><delect id="g80sy"></delect></rt>
  • thinkphp6如何記錄百度等蜘蛛的爬取日志

    程序猿 2021-03-17 20:08:08 2257瀏覽 加載中

    thinkphp6記錄百度蜘蛛日志。在控制器的父類如IndexBase中寫入以下代碼,所有前端控制器繼承這個控制器

      public function initialize()
        {
    
            parent::initialize(); // TODO: Change the autogenerated stub
    
            if ($this->Config['web_status'] == 0) {  // 判斷是否關(guān)閉網(wǎng)站
                die('網(wǎng)站已經(jīng)關(guān)閉');
            }
    
            $this->baiduLog();
        }
    
        protected function baiduLog()
        {
            $useragent = strtolower($_SERVER['HTTP_USER_AGENT']);
            $url = $this->request->controller() . "/" . $this->request->action();
            $param = input("param.","","htmlspecialchars");
            $url = (string) url($url,$param);
            $ip = get_real_ip();
            $title = "";
            if (strpos($useragent, 'googlebot') !== false){
                $title =  'Google';
            } elseif (strpos($useragent, 'baiduspider') !== false){
                $title =  'Baidu';
            } elseif (strpos($useragent, 'msnbot') !== false){
                $title =  'Bing';
            } elseif (strpos($useragent, 'slurp') !== false){
                $title =  'Yahoo';
            } elseif (strpos($useragent, 'sosospider') !== false){
                $title =  'Soso';
            } elseif (strpos($useragent, 'sogou spider') !== false){
                $title =  'Sogou';
            } elseif (strpos($useragent, 'yodaobot') !== false){
                $title =  'Yodao';
            } elseif (strpos($useragent, 'googlebot') !== false){
                $title =  'Google';
            } elseif (strpos($useragent, 'baiduspider') !== false){
                $title =  'Baidu';
            } else {
    //            $title = $useragent; // 不怕數(shù)據(jù)大的話可以取消注釋,記錄所有訪問日志
            }
            if (!empty($title)) {
                BaiduLog::create(["title"=>$title,"href"=>$url,"ip"=>$ip]);
            }
        }

    以上就是thinkphp6記錄百度蜘蛛爬行日志的方法,

    get_real_ip()

    是獲取客戶真實IP的自定義函數(shù),可以在本站搜索找到。

    標(biāo)簽: thinkphp6
    最后修改:2025-07-03 12:09:02

    非特殊說明,本博所有文章均為博主原創(chuàng)。

    主站蜘蛛池模板: 新郑市| 和平区| 贺州市| 洞口县| 苍山县| 普格县| 曲水县| 泰州市| 永济市| 晋宁县| 万年县| 仁布县| 青州市| 岐山县| 长汀县| 安丘市| 汉中市| 太湖县| 阳山县| 龙口市| 金阳县| 武夷山市| 南昌市| 乌拉特前旗| 新野县| 逊克县| 乌兰县| 长葛市| 方山县| 梅州市| 阿勒泰市| 逊克县| 宁化县| 赣州市| 会宁县| 抚松县| 赤壁市| 蛟河市| 马公市| 湛江市| 竹山县|