Stories

List
Create Time

秒拍成片!EX-4D 實現單目視頻的快速 4D 動態場景生成

單目視頻到 4D 動態場景的重建長期以來被視為一個病態逆問題,缺乏基線使深度與運動難以解耦,傳統 SfM 只能恢復靜態外殼,而 NeRF-4D 又依賴數小時的逐場景優化,受制於幾何歧義、數據不足與算力開銷三重瓶頸。 字節跳動旗下的 Pico 團隊推出了新型 4D 視頻生成框架 EX-4D,能從單目視頻輸入生成極端視角下的高質量 4D 視頻。它核心創新在於提出了一種名為深度防水網格(DW-Mesh)

Create Time

跨頁表格不用愁!OCRFlux-3B 一鍵提取乾淨文本

你有沒有試過從 PDF 裏複製一張跨頁表格?粘出來後表格被撕成兩半,排版亂成一團,本來幾分鐘的工作瞬間變成半小時的「拼圖」大戰。 針對這種煩惱,OCRFlux-3B 應運而生。它在 2025 年 6 月由 ChatDOC 團隊發佈,是一個基於多模態大模型的工具包,能把 PDF 和圖片轉成乾淨、可讀的 Markdown 文本。不僅支持頁面級轉換,還能自動合併跨頁表格和段落,讓複雜文檔結構瞬間清爽。