Pandas Trong Python: Đọc, Xử Lý Và Phân Tích Dữ Liệu Như Excel Nhưng Mạnh Hơn
Chia sẻ
"Hướng dẫn toàn diện thư viện Pandas: DataFrame, Series, đọc file, lọc dữ liệu, groupby, merge, pivot table và xuất báo cáo. So sánh với Excel."
Pandas Là Gì?
Pandas là thư viện Python mạnh mẽ nhất cho xử lý và phân tích dữ liệu dạng bảng. Nếu Excel là Microsoft Word thì Pandas là LaTeX — mạnh hơn, linh hoạt hơn, nhưng cần học cách sử dụng. Bài viết này giúp bạn làm chủ Pandas từ đầu.
DataFrame Và Series
import pandas as pd
# Tạo DataFrame từ dict
data = {
"name": ["An", "Bình", "Cường", "Dũng"],
"department": ["Sales", "IT", "Sales", "HR"],
"salary": [12_000_000, 18_000_000, 14_000_000, 11_000_000]
}
df = pd.DataFrame(data)
# Series: 1 cột đơn lẻ
salaries = df["salary"]
print(type(salaries)) # pandas.core.series.SeriesĐọc/Ghi File
# Đọc file
df = pd.read_excel("data.xlsx", sheet_name="Sheet1")
df = pd.read_csv("data.csv", encoding="utf-8-sig")
df = pd.read_json("data.json")
# Ghi file
df.to_excel("output.xlsx", index=False)
df.to_csv("output.csv", index=False, encoding="utf-8-sig")Lọc Dữ Liệu (Tương Tự Filter Trong Excel)
# Lọc theo điều kiện
high_salary = df[df["salary"] > 15_000_000]
sales_team = df[df["department"] == "Sales"]
# Nhiều điều kiện
result = df[(df["department"] == "Sales") & (df["salary"] > 13_000_000)]
# .query() — cú pháp gọn hơn
result = df.query("department == 'Sales' and salary > 13_000_000")GroupBy (Tương Tự Pivot Table)
# Tổng hợp theo phòng ban
df.groupby("department").agg(
count=("name", "count"),
avg_salary=("salary", "mean"),
total_salary=("salary", "sum")
).round(0)Merge — JOIN Trong Pandas
# Tương tự VLOOKUP/JOIN
result = pd.merge(
employees, departments,
left_on="dept_id", right_on="id",
how="left" # left, right, inner, outer
)Kết Luận
Pandas là Excel trên steroid. Với vài dòng code, bạn có thể xử lý hàng triệu dòng dữ liệu mà Excel sẽ đứng hình. Hãy bắt đầu chuyển đổi workflow từ Excel sang Pandas để tăng năng suất gấp 10 lần.
Bình luận
Đăng nhập để tham gia bình luận
Đăng nhậpNhận bài viết mới nhất
Đăng ký để nhận thông báo khi có bài viết mới. Không spam, chỉ kiến thức chất lượng.
Bài viết liên quan
Khám phá thêm các bài viết cùng chủ đề


