填補指定時間段內缺失的連續時間。 extract_time4.py
# -*- coding:utf-8 -*-
# @author:Ye Zhoubing
# @datetime:2025/12/17 16:23
# @software: PyCharm
import pandas as pd
# 讀取 Excel
df = pd.read_excel("轉換後文件.xlsx")
# 假設列名如下(按你的實際改)
date_col = "date"
value_col = "value"
# 轉換時間列為 datetime
df[date_col] = pd.to_datetime(df[date_col])
# 將時間標準化到當天的 0:00(去掉具體時間)
df[date_col] = df[date_col].dt.normalize()
# 去除可能的重複日期(如果有重複,取第一個)
df = df.drop_duplicates(subset=[date_col], keep='first')
# 指定時間段
start_date = "2024-01-01"
end_date = "2025-12-17"
# 創建完整日期的 DataFrame
full_df = pd.DataFrame({
date_col: pd.date_range(start=start_date, end=end_date, freq="D")
})
# 合併完整日期和原始數據
result_df = full_df.merge(df, on=date_col, how='left')
# 保存結果
result_df.to_excel("output.xlsx", index=False)
print("處理完成!")
print(f"原始數據行數: {len(df)}")
print(f"完整日期行數: {len(full_df)}")
print(f"結果行數: {len(result_df)}")