【python数据分析】练习3:描述性统计-信用卡客户画像

数据集及源码https://github.com/JCATHoney/python-data-analysis

一、问题描述

1、不同类型卡的持卡人(type=所有者)的性别对比

2、不同类型卡的持卡人在办卡时的平均年龄对比

3、不同类型卡的持卡人在办卡前一年内的平均帐户余额对比

4、不同类型卡的持卡人在办卡前一年内的平均收入对比

二、数据集

描述:本数据为一家银行的个人金融业务数据集,可以作为银行场景下进行个人客户业务分析和数据挖掘的示例。这份数据中涉及到5300个银行客户的100万笔的交易,而且涉及700份贷款信息与近900张信用卡的数据。通过分析这份数据可以获取与银行服务相关的业务知识在这里插入图片描述
总共8张表:

表结构

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

E-R图:

在这里插入图片描述

3、求解

1、 不同类型卡的持卡人(type=所有者)的性别对比
2、不同类型卡的持卡人在办卡时的平均年龄对比

分析:
需要的信息:持卡类型,持卡人性别,持卡人年龄,发卡时间
涉及的表格:card,disp,client
(1)表连接

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import matplotlib
import seaborn as sns
import os
import time#%%
os.chdir(r'C:\Users\Away\Desktop\笔记\数据分析\数据科学实践')
#%%
#先读取三张表
card= pd.read_csv('card.csv',encoding='gbk')
disp= pd.read_csv('disp.csv',encoding='gbk')#权限分配表
clients= pd.read_csv('clients.csv',encoding='gbk')#%%
import sqlite3 # sqlite3相当于轻量版,更多功能可使用SQLAlchemy
con = sqlite3.connect(':memory:') # 数据库连接
# sale.to_sql('sale', con) # 将DataFrame注册成可用sql查询的表
# newTable = pd.read_sql_query("select year, market,


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部