前言
之前我整理了關於安卓和js逆向相關的一百多公眾號,有興趣的可以看:學習逆向的一百多個公眾號整理彙總。GitHub倉庫地址:https://github.com/kanadeblisst00/high-quality-biz。
這篇文章來將這些公眾號所有的歷史文章下載成pdf的格式,然後上傳到知識庫裏看看問答的效果怎麼樣。後面也會每週增量更新上一週的文章到知識庫裏。這麼看來RSS訂閲的形式其實不如做成知識庫來閲讀的方便,因為你也可以瀏覽文章,還能問答。
就是有些逆向文章可能比較敏感,發佈沒多久就被刪除了,這樣如果一週保存一次感覺就會漏掉這類文章。後面看看要不要加上監聽公眾號更新然後自動下載公眾號文章的功能。
知識庫選擇
知識庫需要滿足以下條件:
- 可以公開分享,並且國內用户能訪問到
- 可以批量上傳,最好是能直接上傳文件夾
- 容量夠,可以存一百多個公眾號的所有歷史文章(目前已經25G)
- 支持大文件上傳,有的pdf可能有二三十兆
雖然某些知識庫可能模型很強,回答的比較好,但如果無法滿足上面的條件,即使知識庫使用的模型再強也發揮不了什麼作用。
目前找了幾個測試,只有騰訊的ima滿足這些條件(很多都是不支持大文件上傳和容量很低),所以這裏就以它來作為示例。
如果大家有更好的選擇,可以在評論區發表一下建議,當然自建的知識庫也在考慮範圍內。
分享鏈接
所有文件已經全部上傳到知識庫裏,大家想要體驗的可以訪問 【ima知識庫】學習逆向的公眾號文章: https://ima.qq.com/wiki/?shareId=64905d8ac534b9104c97b7b62da31f07faa0bc09a4429e3fbe7f8aa1c14a1991
我還沒開始分享鏈接,已經有人在ima的發現里加入了。
知識庫
ima的使用方法我這裏就不多説了,基本也沒什麼複雜的步驟。後面會不定時上傳增量文章到知識庫裏,不過每個知識庫的容量是30G,現在已經25G多,估計不需要多久就到達上限了。
後面到了再看吧,其實已經下載的文章裏有很多文章並非逆向相關的,或者可能就是廣告,有時間再一一篩選刪除吧。大家有發現的也可以提醒我刪除掉。
測試問題1
某音加密參數a-bogus如何逆向
回答的結果其實不是很重要,主要是他能找到哪些文章包含了該問題。然後我們可以自己看文章來找答案,等於只是把它當成了更智能的全文搜索。
不知道這些引用能不能排序,例如我想按時間來排序。或者説知識庫的答案能否優先最新的文章,因為逆向的時效性其實很高,去年的文章也許並沒有什麼參考性了。
不過目前上傳文件的時候並沒有讓設置文件時間,拿現在這個功能肯定是沒有的。
有意思的是它還能截圖文檔中的一部分給你説明(下載的時候並沒有加載全部評論,這個可能也是一個優化點,評論其實也有搜索的價值)
測試問題2
某音APP端如何實現抓包請求
感覺效果還挺強怎麼回事,後面綠色的序號是説明這句話引用自哪個文檔,鼠標放上去就能看到。
測試問題3
第三個問題我們問點不一樣的
看來確實有不少大佬有自己的知識星球
總結
感覺ima知識庫已經足夠滿足我的要求了,後面只需要將文章增刪維護就行了,不過如果有新的方案肯定還是得體驗一下的。
知識庫大家可以自行玩吧,有什麼建議也可以評論告訴我。