久久久久久久av_日韩在线中文_看一级毛片视频_日本精品二区_成人深夜福利视频_武道仙尊动漫在线观看

如何采集微信公眾號歷史消息頁

給大家講解了微信公眾號文章采集的入口歷史消息頁信息獲取方法,有需要的朋友參考一下本內容。

采集微信文章和采集網站內容一樣,都需要從一個列表頁開始。而微信文章的列表頁就是公眾號里的查看歷史消息頁。現在網絡上的其它微信采集器有的是利用搜狗搜索,采集方式雖然簡單多了,但是內容不全。所以我們還是要從最標準最全面的公眾號歷史消息頁來采集。

因為微信的限制,我們能復制到的鏈接是不完整的,在瀏覽器中無法打開看到內容。所以我們需要通過上一篇文章介紹的方法,使用anyproxy獲取到一個完整的微信公眾號歷史消息頁面的鏈接地址。

http://mp.weixin.qq.com/mp/getmasssendmsg?__biz=MjM5NDAwMTA2MA==&uin=NzM4MTk1ODgx&key=bf9387c4d02682e186a298a18276d8e0555e3ab51d81ca46de339e6082eb767343bef610edd80c9e1bfda66c2b62751511f7cc091a33a029709e94f0d1604e11220fc099a27b2e2d29db75cc0849d4bf&devicetype=android-17&version=26031c34&lang=zh_CN&nettype=WIFI&ascene=3&pass_ticket=Iox5ZdpRhrSxGYEeopVJwTBP7kZj51GYyEL24AT5Zyx%2BBoEMdPDBtOun1F%2F9ENSz&wx_header=1

前一篇文章提到過,biz參數是公眾號的ID,uin是用戶的ID,目前來看uin是在所有公眾號之間唯一的。其它兩個重要參數key和pass_ticket是微信客戶端補充上的參數。

所以在這個地址失效之前我們是可以通過瀏覽器查看原文的方法獲取到歷史消息的文章列表的,如果希望自動化分析內容,也可以制作一個程序,將這個帶有尚未失效的key和pass_ticket的鏈接地址提交進去,再通過例如php程序來獲取到文章列表。

最近有朋友跟我說他的采集目標就是單一的一個公眾號,我覺得這樣就沒必要用上一篇文章寫的批量采集的方法了。所以我們接下來看看歷史消息頁里面是怎樣獲取到文章列表的,通過分析文章列表,就可以得到這個公眾號所有的內容鏈接地址,然后再采集內容就可以了。

在anyproxy的web界面中如果證書配置正確,是可以顯示出https的內容的。web界面的地址是http://localhost:8002 其中localhost可以替換成自己的IP地址或域名。從列表中找到getmasssendmsg開頭的記錄,點擊之后右側就會顯示出這條記錄的詳情:

如何采集微信公眾號歷史消息頁

紅框部分就是完整的鏈接地址,將微信公眾平臺這個域名拼接在前面之后就可以在瀏覽器中打開了。

然后將頁面向下拉,到html內容的結尾部分,我們可以看到一個json的變量就是歷史消息的文章列表:

如何采集微信公眾號歷史消息頁

我們將msgList的變量值拷貝出來,用json格式化工具分析一下,我們就可以看到這個json是以下這個結構:

{
  "list": [
    {
      "app_msg_ext_info": {
        "author": "",
        "content": "",
        "content_url": "http://mp.weixin.qq.com/s?__biz=MzA5MzEzNDg3MQ==&mid=2652767427&idx=1&sn=37da0d7208283bf90e9a4a536e0af0ea&chksm=8b882dbbbcffa4ad2f0b8a141cc988d16bace564274018e68e5c53ee6f354f8ad56c9b98bade&scene=4#wechat_redirect",
        "copyright_stat": 100,
        "cover": "http://mmbiz.qpic.cn/mmbiz/MofBAcBsJ6X0xGrQ2XK5yQjzwb2eswxkRNBTgLtcqGziaFqwibzvtZAHCDkMeJU1fGZHpjoeibanPJ8rziaq68Akkg/0?wx_fmt=jpeg",
        "digest": "擦亮雙眼,遠離謠言。",
        "fileid": 505283695,
        "is_multi": 1,
        "multi_app_msg_item_list": [
          {
            "author": "",
            "content": "",
            "content_url": "http://mp.weixin.qq.com/s?__biz=MzA5MzEzNDg3MQ==&mid=2652767427&idx=2&sn=449ef1a874a37fed2429e14f724b56ef&chksm=8b882dbbbcffa4ade48a7932cda4263687e34fca8ea3a5a6233d2589d448b9f6130d3890ce93&scene=4#wechat_redirect",
            "copyright_stat": 100,
            "cover": "http://mmbiz.qpic.cn/mmbiz_png/MofBAcBsJ6XyaIn0qEDSSicBUBZbMYHYrhibia89ZnksCsUiaia2TLI1fyqjclibGa1hw3icP6oXeSpaWMjiabaghHl7yw/0?wx_fmt=png",
            "digest": "12月28日,廣州亞運城綜合體育館,內附購票入口~",
            "fileid": 0,
            "source_url": "http://wechat.show.wepiao.com/detail/ff764b0731b7465db03b56b998e1f2b8?detailReferrer=1&from=groupmessage&isappinstalled=0",
            "title": "2017微信公開課Pro版即將召開"
          },
         ...//循環被省略
        ],
        "source_url": "",
        "subtype": 9,
        "title": "謠言熱榜 | 十一月朋友圈十大謠言"
      },
      "comm_msg_info": {
        "content": "",
        "datetime": 1480933315,
        "fakeid": "3093134871",
        "id": 1000000010,
        "status": 2,
        "type": 49 //類型為49的時候是圖文消息
      }
    },
   ...//循環被省略
  ]
}

簡要的分析一下這個json(這里只介紹一些重要的信息,其它的被省略):

"list": [ //最外層的鍵名;只出現一次,所有內容都被它包含。
  {//這個大闊號之內是一條多圖文或單圖文消息,通俗的說就是一天的群發都在這里
    "app_msg_ext_info":{//圖文消息的擴展信息
      "content_url": "圖文消息的鏈接地址",
      "cover": "封面圖片",
      "digest": "摘要",
      "is_multi": "是否多圖文,值為1和0",
      "multi_app_msg_item_list": [//這里面包含的是從第二條開始的圖文消息,如果is_multi=0,這里將為空
        {
          "content_url": "圖文消息的鏈接地址",
          "cover": "封面圖片",
          "digest": ""摘要"",
          "source_url": "閱讀原文的地址",
          "title": "子內容標題"
        },
        ...//循環被省略
      ],
      "source_url": "閱讀原文的地址",
      "title": "頭條標題"
    },
    "comm_msg_info":{//圖文消息的基本信息
      "datetime": '發布時間,值為unix時間戳',
      "type": 49 //類型為49的時候是圖文消息
    }
  },
  ...//循環被省略
]
【網站聲明】本站除付費源碼經過測試外,其他素材未做測試,不保證完整性,網站上部分源碼僅限學習交流,請勿用于商業用途。如損害你的權益請聯系客服QQ:2655101040 給予處理,謝謝支持。

相關文檔推薦

給大家分析一下如何用PHP寫出采集微信公眾號文章的方法以及代碼詳細講解,需要的朋友學習一下。
主站蜘蛛池模板: 日韩无 | 丁香五月网久久综合 | 美女久久 | 亚洲欧美一区二区三区视频 | 婷婷91| 精品欧美一区二区在线观看视频 | 亚洲精品久久久蜜桃 | 午夜在线| 五月激情综合 | 成人在线免费观看 | 日韩av啪啪网站大全免费观看 | 中文字幕国产精品 | 久久精品视频一区二区三区 | 欧美片网站免费 | 欧美福利专区 | 成人精品国产免费网站 | 91精品久久久久久久久 | 久久夜色精品国产 | www.成人.com | 密室大逃脱第六季大神版在线观看 | 欧美一区视频 | 国产不卡视频在线 | 精品久久久久久久 | 国产96色在线 | 日本免费一区二区三区四区 | 国产免费拔擦拔擦8x高清 | 在线91 | 91亚洲精品国偷拍自产在线观看 | 国产大片黄色 | 欧美国产日韩在线观看成人 | 精品视频一区二区 | 日韩精品在线观看一区二区三区 | 91综合在线视频 | 久久夜视频 | 久久黄色网 | 亚洲国产精品视频 | 观看av| 亚洲最大福利网 | 麻豆久久久9性大片 | 亚洲乱码国产乱码精品精98午夜 | 亚洲人成人一区二区在线观看 |