news 2026/6/23 2:50:50

建模步骤 3 :数据探索(EDA) — 1、初步了解数据:自定义函数

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
建模步骤 3 :数据探索(EDA) — 1、初步了解数据:自定义函数
👏

1、自定义函数概述
--(1)title()
--(2)df_table(df)
--(3)df_style(df)
--(4)des_table(df)
--(5)des_chart(df)

1、自定义函数概述

尝试自己创建一个名为my_package模块,该模块中存放一些自定义的数据分析函数,可以重复调用。如下图在当前目录下,创建一个名为my_package的文件夹,在该文件夹下面创建一个名为__pycache__的子文件夹;然后创建两个python模块(View.pyDEA.py);接着在这两个模块中定义函数。

👏

具体函数如下:

函数解释存放模块
title('')显示一个标题View.py
df_table(df)用表格的方式展示数据框View.py
df_style(df)为数据框添加边框或热力图View.py
des_table(df)数据框概要表DEA.py
des_chart(df)数据框每个特征分布可视化DEA.py
......

上表是我在初步了解数据过程中的几个自定义的函数,主要是将上一篇文章中的常用函数组合在一起使用。

(1)title()

# 导入库里面的模块,然后调用函数 from my_package import View View.title('Good') View.title('Good', style="#512b58") View.title('Good', style="bold #fe346e") View.title('Good', count=80)

(2)df_table(df)

import numpy as np import pandas as pd df = pd.DataFrame( np.random.randn(4, 6) , columns=list("ABCDEF") ) df

from my_package import View # 参数 tablefmt 参考 tabulate 库 # 可能对中文支持不是很友好 print('\n') View.df_table(df) View.df_table(df, tablefmt="psql") View.df_table(df, tablefmt="rounded_grid")

(3)df_style(df)

from my_package import View View.df_style(df, background=True)

from my_package import View View.df_style(df, background=False)

(4)des_table(df)

import os file = os.path.join('datasets','titanic','train.csv') import pandas as pd df = pd.read_csv(file) df.head()

from my_package import DEA DEA.des_table(df)

(5)des_chart(df)

from my_package import DEA DEA.des_chart(df)

👏

总结:以上是我在初步了解数据过程中的几个自定义的函数,主要是将上一篇文章中的常用函数组合在一起使用。并且,尝试创建了一个简单的库来存储,方便重复执行。更多的pandas函数可以查看 pandas 函数

  • 以上函数代码存放位置:
    https://gitee.com/wwj2011125/my-package

  • Python 中的变量、函数、类、模块和库的简单解释

Python 端到端的机器学习

AI入门:详细介绍机器学习建模过程,步骤细节;以及人工智能的分阶段学习线路图。

🚀 点击查看

统计学习\机器学习\深度学习算法

介绍有关统计学习,机器学习,深度学习的算法。

🚀 点击查看

SQL + Pandas 练习题

SQL 练习题目,使用 Pandas 库实现,使用 Sqlalchemy 库查看 SQL 代码血缘关系。

🚀 点击查看

Python 数据可视化

介绍了有关 Matplotlib,Seaborn,Plotly 几个 Python 绘图库的简单使用。

🚀 点击查看
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/22 9:36:08

Wan2.2-T2V-A14B支持复杂场景描述的理解机制剖析

Wan2.2-T2V-A14B 支持复杂场景描述的理解机制剖析在影视制作的前期流程中,你有没有遇到过这样的窘境:导演激情澎湃地描绘一个“穿汉服的小女孩在樱花树下跳舞,微风拂发,古筝声起”,结果预演视频出来——人像纸片、动作…

作者头像 李华
网站建设 2026/6/23 21:06:39

BiliFM:高效下载B站音频的专业工具

BiliFM:高效下载B站音频的专业工具 【免费下载链接】BiliFM 下载指定 B 站 UP 主全部或指定范围的音频,支持多种合集。A script to download all audios of the Bilibili uploader you love. 项目地址: https://gitcode.com/jingfelix/BiliFM Bil…

作者头像 李华
网站建设 2026/6/18 23:11:47

WanVideo FP8量化模型:AI视频生成新标杆

WanVideo FP8量化模型:AI视频生成新标杆 【免费下载链接】WanVideo_comfy_fp8_scaled 项目地址: https://ai.gitcode.com/hf_mirrors/Kijai/WanVideo_comfy_fp8_scaled 视频创作领域迎来重大突破!WanVideo FP8量化模型正式发布,这款基…

作者头像 李华
网站建设 2026/6/19 4:25:17

AsyncHttpClient:构建高性能异步HTTP和WebSocket客户端的完整指南

AsyncHttpClient:构建高性能异步HTTP和WebSocket客户端的完整指南 【免费下载链接】async-http-client Asynchronous Http and WebSocket Client library for Java 项目地址: https://gitcode.com/gh_mirrors/as/async-http-client 在现代分布式系统和微服务…

作者头像 李华
网站建设 2026/6/23 6:30:46

2025企业AI网关终极指南:3大架构策略实现多模型统一治理

2025企业AI网关终极指南:3大架构策略实现多模型统一治理 【免费下载链接】APIPark 🦄云原生、超高性能 AI&API网关,LLM API 管理、分发系统、开放平台,支持所有AI API,不限于OpenAI、Azure、Anthropic Claude、Goo…

作者头像 李华