久久久久久久av_日韩在线中文_看一级毛片视频_日本精品二区_成人深夜福利视频_武道仙尊动漫在线观看

如何采集微信公眾號歷史消息頁

給大家講解了微信公眾號文章采集的入口歷史消息頁信息獲取方法,有需要的朋友參考一下本內容。

采集微信文章和采集網站內容一樣,都需要從一個列表頁開始。而微信文章的列表頁就是公眾號里的查看歷史消息頁。現在網絡上的其它微信采集器有的是利用搜狗搜索,采集方式雖然簡單多了,但是內容不全。所以我們還是要從最標準最全面的公眾號歷史消息頁來采集。

因為微信的限制,我們能復制到的鏈接是不完整的,在瀏覽器中無法打開看到內容。所以我們需要通過上一篇文章介紹的方法,使用anyproxy獲取到一個完整的微信公眾號歷史消息頁面的鏈接地址。

http://mp.weixin.qq.com/mp/getmasssendmsg?__biz=MjM5NDAwMTA2MA==&uin=NzM4MTk1ODgx&key=bf9387c4d02682e186a298a18276d8e0555e3ab51d81ca46de339e6082eb767343bef610edd80c9e1bfda66c2b62751511f7cc091a33a029709e94f0d1604e11220fc099a27b2e2d29db75cc0849d4bf&devicetype=android-17&version=26031c34&lang=zh_CN&nettype=WIFI&ascene=3&pass_ticket=Iox5ZdpRhrSxGYEeopVJwTBP7kZj51GYyEL24AT5Zyx%2BBoEMdPDBtOun1F%2F9ENSz&wx_header=1

前一篇文章提到過,biz參數是公眾號的ID,uin是用戶的ID,目前來看uin是在所有公眾號之間唯一的。其它兩個重要參數key和pass_ticket是微信客戶端補充上的參數。

所以在這個地址失效之前我們是可以通過瀏覽器查看原文的方法獲取到歷史消息的文章列表的,如果希望自動化分析內容,也可以制作一個程序,將這個帶有尚未失效的key和pass_ticket的鏈接地址提交進去,再通過例如php程序來獲取到文章列表。

最近有朋友跟我說他的采集目標就是單一的一個公眾號,我覺得這樣就沒必要用上一篇文章寫的批量采集的方法了。所以我們接下來看看歷史消息頁里面是怎樣獲取到文章列表的,通過分析文章列表,就可以得到這個公眾號所有的內容鏈接地址,然后再采集內容就可以了。

在anyproxy的web界面中如果證書配置正確,是可以顯示出https的內容的。web界面的地址是http://localhost:8002 其中localhost可以替換成自己的IP地址或域名。從列表中找到getmasssendmsg開頭的記錄,點擊之后右側就會顯示出這條記錄的詳情:

如何采集微信公眾號歷史消息頁

紅框部分就是完整的鏈接地址,將微信公眾平臺這個域名拼接在前面之后就可以在瀏覽器中打開了。

然后將頁面向下拉,到html內容的結尾部分,我們可以看到一個json的變量就是歷史消息的文章列表:

如何采集微信公眾號歷史消息頁

我們將msgList的變量值拷貝出來,用json格式化工具分析一下,我們就可以看到這個json是以下這個結構:

{
  "list": [
    {
      "app_msg_ext_info": {
        "author": "",
        "content": "",
        "content_url": "http://mp.weixin.qq.com/s?__biz=MzA5MzEzNDg3MQ==&mid=2652767427&idx=1&sn=37da0d7208283bf90e9a4a536e0af0ea&chksm=8b882dbbbcffa4ad2f0b8a141cc988d16bace564274018e68e5c53ee6f354f8ad56c9b98bade&scene=4#wechat_redirect",
        "copyright_stat": 100,
        "cover": "http://mmbiz.qpic.cn/mmbiz/MofBAcBsJ6X0xGrQ2XK5yQjzwb2eswxkRNBTgLtcqGziaFqwibzvtZAHCDkMeJU1fGZHpjoeibanPJ8rziaq68Akkg/0?wx_fmt=jpeg",
        "digest": "擦亮雙眼,遠離謠言。",
        "fileid": 505283695,
        "is_multi": 1,
        "multi_app_msg_item_list": [
          {
            "author": "",
            "content": "",
            "content_url": "http://mp.weixin.qq.com/s?__biz=MzA5MzEzNDg3MQ==&mid=2652767427&idx=2&sn=449ef1a874a37fed2429e14f724b56ef&chksm=8b882dbbbcffa4ade48a7932cda4263687e34fca8ea3a5a6233d2589d448b9f6130d3890ce93&scene=4#wechat_redirect",
            "copyright_stat": 100,
            "cover": "http://mmbiz.qpic.cn/mmbiz_png/MofBAcBsJ6XyaIn0qEDSSicBUBZbMYHYrhibia89ZnksCsUiaia2TLI1fyqjclibGa1hw3icP6oXeSpaWMjiabaghHl7yw/0?wx_fmt=png",
            "digest": "12月28日,廣州亞運城綜合體育館,內附購票入口~",
            "fileid": 0,
            "source_url": "http://wechat.show.wepiao.com/detail/ff764b0731b7465db03b56b998e1f2b8?detailReferrer=1&from=groupmessage&isappinstalled=0",
            "title": "2017微信公開課Pro版即將召開"
          },
         ...//循環被省略
        ],
        "source_url": "",
        "subtype": 9,
        "title": "謠言熱榜 | 十一月朋友圈十大謠言"
      },
      "comm_msg_info": {
        "content": "",
        "datetime": 1480933315,
        "fakeid": "3093134871",
        "id": 1000000010,
        "status": 2,
        "type": 49 //類型為49的時候是圖文消息
      }
    },
   ...//循環被省略
  ]
}

簡要的分析一下這個json(這里只介紹一些重要的信息,其它的被省略):

"list": [ //最外層的鍵名;只出現一次,所有內容都被它包含。
  {//這個大闊號之內是一條多圖文或單圖文消息,通俗的說就是一天的群發都在這里
    "app_msg_ext_info":{//圖文消息的擴展信息
      "content_url": "圖文消息的鏈接地址",
      "cover": "封面圖片",
      "digest": "摘要",
      "is_multi": "是否多圖文,值為1和0",
      "multi_app_msg_item_list": [//這里面包含的是從第二條開始的圖文消息,如果is_multi=0,這里將為空
        {
          "content_url": "圖文消息的鏈接地址",
          "cover": "封面圖片",
          "digest": ""摘要"",
          "source_url": "閱讀原文的地址",
          "title": "子內容標題"
        },
        ...//循環被省略
      ],
      "source_url": "閱讀原文的地址",
      "title": "頭條標題"
    },
    "comm_msg_info":{//圖文消息的基本信息
      "datetime": '發布時間,值為unix時間戳',
      "type": 49 //類型為49的時候是圖文消息
    }
  },
  ...//循環被省略
]
【網站聲明】本站除付費源碼經過測試外,其他素材未做測試,不保證完整性,網站上部分源碼僅限學習交流,請勿用于商業用途。如損害你的權益請聯系客服QQ:2655101040 給予處理,謝謝支持。

相關文檔推薦

給大家分析一下如何用PHP寫出采集微信公眾號文章的方法以及代碼詳細講解,需要的朋友學習一下。
主站蜘蛛池模板: 国产1区2区在线观看 | 国产精品日本一区二区在线播放 | 国产美女在线看 | 蜜臀久久99精品久久久久久宅男 | 一区二区三区精品在线 | 羞羞视频网站免费看 | 欧美日韩综合精品 | 亚洲精品国产电影 | 91美女视频| 久久亚洲综合 | 亚洲成人精品 | 性福视频在线观看 | 欧美成人在线免费 | 国产精品日产欧美久久久久 | 国产aⅴ爽av久久久久久久 | 久久精品亚洲一区 | 日韩精品成人 | 久久成人一区 | 99久久久久久久久 | 国产精品一区二区在线 | 久久91精品国产一区二区三区 | 国产丝袜一区二区三区免费视频 | 精品一区国产 | 欧美成人h版在线观看 | 午夜激情小视频 | 精品一区二区免费视频 | 免费黄色在线观看 | 国产伦精品一区二区三区精品视频 | 黄片毛片在线观看 | 国产精品永久免费 | 国产精品久久久久久久久免费桃花 | 国产91av视频 | 日韩有码一区 | 日韩av一区二区在线观看 | 亚洲一区二区三区视频在线 | 天天操网| 午夜免费在线 | 久久久久久国产精品mv | 日韩中文字幕在线 | 欧美一区二区三区精品免费 | 国产成人精品在线 |