tag pandas

標籤
貢獻13
92
04:55 AM · Oct 28 ,2025

@pandas / 博客 RSS 訂閱

flybirdfly - df 根據索引其中之一篩選 根據索引名得到索引號

第三章 索引 本章數據: import numpy as np import pandas as pd 一、索引器 1. 表的列索引 列索引是最常見的索引形式,一般通過[]來實現。通過[列名]可以從DataFrame中取出相應的列,返回值為Series,例如從表中取出姓名一列:

機器學習 , 大數據 , 數據倉庫 , pandas , 數據分析 , df 根據索引其中之一篩選 , Python

收藏 評論

deephub - 15個基本且常用Pandas代碼片段

Pandas提供了強大的數據操作和分析功能,是數據科學的日常基本工具。在本文中,我們將介紹最常用的15個Pandas代碼片段。這些片段將幫助簡化數據分析任務,從數據集中提取有價值的見解。 1、過濾數據 Pandas提供了多種方法來過濾數據。 import pandas as pd # Create a DataFrame data = {'Name': ['Alice', 'Bob',

機器學習 , 人工智能 , pandas , 數據分析

收藏 評論

deephub - 向量化操作簡介和Pandas、Numpy示例

Pandas是一種流行的用於數據操作的Python庫,它提供了一種稱為“向量化”的強大技術可以有效地將操作應用於整個列或數據系列,從而消除了顯式循環的需要。在本文中,我們將探討什麼是向量化,以及它如何簡化數據分析任務。 什麼是向量化? 向量化是將操作應用於整個數組或數據系列的過程,而不是逐個遍歷每個元素。在Pandas中可以對整個列或Series執行操作,而無需編寫顯式循環。這種高效的方法利用了

機器學習 , numpy , 人工智能 , pandas , Python

收藏 評論

Jing_H - pandas使用相關問題記錄

1-na值相關。na值有多種,這是較為完善的一種判斷: if value in (None, pd.NaT, np.nan) or pd.isna(value): 因為遇到一種情況,print出來是nan,type是class 'float',但就是沒有進入if裏面。 問了ai,加了or後面的內容,才進入if。 2-切片問題

numpy , pandas , Python

收藏 評論

deephub - 一份寫給數據工程師的 Polars 遷移指南:將 Pandas 速度提升 20 倍代碼重構實踐

在大數據處理領域,性能和效率始終是核心問題。 polars 作為新一代數據處理框架,通過利用Rust語言的底層實現和現代化的並行計算架構,在處理大規模數據集時展現出顯著的性能優勢。根據性能測試文章的數據顯示,在CSV文件讀取操作中, polars 的處理速度可達 pandas 的20倍。這種性能提升主要得益於其優化的內存管理機制和並行計算能力。 本文將系統地介紹如何從 pandas 遷移到 po

機器學習 , 人工智能 , pandas , Python

收藏 評論

TeamCode - Python 教程:從 Python 爬蟲到數據分析

數據分析是 Python 編程廣泛應用的領域之一,數據分析員藉助 Python 語法簡單明晰、應用範圍廣泛的特性,通過爬蟲、整合數據等多樣化的依賴與函數,進一步提高數據分析的能力與效率。 在這篇教程中,同學將整合之前所學習的 Python 爬蟲技巧,進一步學習如何將所爬取的數據儲存到 CSV 文件中。 學習 Python 爬蟲,手把手通過 Python 入門爬取網頁信息: https://z

beautifulsoup , pandas , 數據分析 , 爬蟲 , Python

收藏 評論

霍格沃茲測試學院 - Pandas read_csv 參數詳解

前言 在使用 Pandas 進行數據分析和處理時,read_csv 是一個非常常用的函數,用於從 CSV 文件中讀取數據並將其轉換成 DataFrame 對象。read_csv 函數具有多個參數,可以根據不同的需求進行靈活的配置。本文將詳細介紹 read_csv 函數的各個參數及其用法,幫助大家更好地理解和利用這一功能。 常用參數概述 pandas的 read_csv 函數用於讀取CSV文件。以

軟件測試 , 測試開發 , pandas , Python

收藏 評論

deephub - 告別低效代碼:用對這10個Pandas方法讓數據分析效率翻倍

對於 Python 數據處理的初學者而言,早期的 Pandas 代碼往往充斥着基礎的 .head() 、 .dropna() 調用以及大量的在線搜索。然而,掌握一些核心的處理模式後,Pandas 將展現出其快速、表達力強且優雅的特性。 本文將介紹 10 個在數據處理中至關重要的 Pandas 技術模式。這些模式能夠顯著減少調試時間,提升代碼的可維護性,並構建更加清晰的數據處理流水線。 使用

機器學習 , 數據挖掘 , 人工智能 , pandas , Python

收藏 評論