numpy下06输入与输出

2023-10-19 01:07:25

输入和输出

numpy二进制文件
save()、savez()和load()函数以numpy专用的二进制类型（npy、npz）保存和读取数据，这三个函数会自动处理ndim、dtype、shape等信息，使用他们读取数组非常方便，但是save()输出的文件很难与其他语言编写的程序兼容。

npy格式：以二进制的方式存储文件，在二进制文件第一行以文本形式保存了数据的元信息（nidm、dtype、shape等），可以用二进制工具查看内容。
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-yeDptKZh-1606185102357)(attachment:2020-11-24_09-17.png)]

vim -b test.npy
:%!xdd#转化为十六进制查看

在这里插入图片描述

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-VrOvZNEc-1606185102360)(attachment:image.png)]

npz格式：以压缩打包的方式存储文件，可以用压缩软件解压。

numpy.save(file,arr,allow_pickle=True,fix_imports=True)Save an array to a binary file in Numpy .npy format.
numpy.load(file,mmap_mode=None,allow_pickle=False,fix_imports=True,encoding=‘ASCII’)Load arrays or pickleed objects from .npy,.npz or pickle files.

import numpy as np
outfile = r'./test.npy'
np.random.seed(20201123)
x = np.random.uniform(0,1,[3,5])
np.save(outfile,x)
y = np.load(outfile)
print(y)
'''
[[0.03911501 0.91357784 0.21820335 0.61869406 0.25371066][0.75731372 0.16270282 0.77498589 0.41520052 0.15138986][0.34765902 0.22682386 0.80095883 0.39216596 0.79913296]]
'''

[[0.03911501 0.91357784 0.21820335 0.61869406 0.25371066][0.75731372 0.16270282 0.77498589 0.41520052 0.15138986][0.34765902 0.22682386 0.80095883 0.39216596 0.79913296]]

numpy.savez(file,*args,**kwds) Save several arrays into a single file in uncompressed .npz format.

savez() 第一个参数是文件名，后面的参数都是要保存的数组，也可以使用关键字参数为数组起一个名字，非关键字参数传递的数组会自动起名为arr_0,arr_1,…。

savez()输出的是一个压缩文件（扩展名为npz），其中每个文件都是一个save()保存的npz文件，文件名对应于数组名。load()自动识别npz文件，并且返回一个类似于字典的对象，可以通过数组名作为关键字获取数组的内容。

outfile = 'test.npz'
x = np.linspace(0,np.pi,5)
y = np.sin(x)
z = np.cos(x)
np.savez(outfile,x,y,z_d=z)
data = np.load(outfile)
np.set_printoptions(suppress=True)
print(data.files,'\n')
print(data['arr_0'],'\n')
print(data['arr_1'],'\n')
print(data['z_d'],'\n')

['z_d', 'arr_0', 'arr_1'] [0.         0.78539816 1.57079633 2.35619449 3.14159265] [0.         0.70710678 1.         0.70710678 0.        ] [ 1.          0.70710678  0.         -0.70710678 -1.        ]

用解压软件打开test.npz文件，会发现其中有三个文件：arr_0.npz,arr_1.npz,z_d.npz,其中分别存着数组x，y，z的内容

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-oqMYzYYe-1606185102362)(attachment:image.png)]

文本文件

savetxt(),lodatxt()和genfromtxt()函数用来存储和读取文本文件（如TXT，CSV等）。
genfromtxt()比loadtxt()更加强大，可以用来对缺失数据进行处理。

numpy.savetxt(fname,X,fmt=’%.18e’,delimiter=’ ‘,newline=’\n’,header=’’,footer=’’,comments=’# ',encoding=None)Save an array to a text file.
- fname:文件路径
- X:存入文件的数组。
- fmt:写入文件中每个元素的字符串格式，默认’%.18e’（保留18位小数的浮点数形式）。
- delimiter: 分割字符串，默认为空格。
numpy.loadtxt(fname,dtype=float,comments=’#’,delimiter=None,converters=None,skiprow=0,usecols=None,unpack=False,ndmin=0,encoding=‘bytes’,max_rows=None)Load data from a text file.
- fname：文件路径。
- dtype:数据类型，默认为float。
- comments:字符串或字符串组成的列表，默认为#，表示注释字符集开始的标志。
- skiprows:跳过多少行，一般跳过第一行表头。
- usecols:元组（元组内数据为列的数值索引），用来指定要读取数据的列（第一列为0）
- unpack:当加载多列数据时是否需要将数据列进行解耦赋值给不同的变量。

outfile = 'test.txt'
x = np.arange(0,10).reshape(2,-1)
np.savetxt(outfile,x)
y = np.loadtxt(outfile)
print(y)

[[0. 1. 2. 3. 4.][5. 6. 7. 8. 9.]]

test.txt文件内容：
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ivKJV0Sm-1606185102364)(attachment:2020-11-24_09-38.png)]

outfile = 'test.csv'
x = np.arange(0,10,0.5).reshape(4,-1)
np.savetxt(outfile,x,fmt='%.3f',delimiter=',')
y = np.loadtxt(outfile,delimiter=',')
print(y)

[[0.  0.5 1.  1.5 2. ][2.5 3.  3.5 4.  4.5][5.  5.5 6.  6.5 7. ][7.5 8.  8.5 9.  9.5]]

test.csv文件如下：
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-Nqk2Bxrw-1606185102366)(attachment:2020-11-24_09-41.png)]

genfromtxt()是面向结构数组和缺失数据处理的。

numpuy.genfromtxt(fname,dtype=float,comments=’#’,delimiter=None,skip_header=0,skip_footer=0,converters=None
,missing_value=None,filling_value=None,usecols=None,names=None,excludelist=None
,deletechars=’’.join(sorted(NameValidator.defaultdeletechars))
,replace_space=’_’,autostrip=False,case_sensitive=True,defaultfmt=‘f%i’,unpack=None
,usemask=False,loose=True,invalid_raise=True,max_rows=None,encoding=‘bytes’)
Load data from a text file,with missing values handled as specified.
- names:设置为True时，程序将把第一行作为列名称。

data.csv文件内容如下：
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-WqE52dWJ-1606185102367)(attachment:2020-11-24_09-58.png)]

outfile='data.csv'
x = np.loadtxt(outfile,delimiter=',',skiprows=1)
print(x)
x = np.loadtxt(outfile,delimiter=',',skiprows=1,usecols=(1,2))
print(x)
val1,val2 = np.loadtxt(outfile,delimiter=',',skiprows=1,usecols=(1,2),unpack=True)
print(val1)
print(val2)

[[  1.  123.    1.4  23. ][  2.  110.    0.5  18. ][  3.  164.    2.1  19. ]]
[[123.    1.4][110.    0.5][164.    2.1]]
[123. 110. 164.]
[1.4 0.5 2.1]

data1.csv文件
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-cECkRPbn-1606185102369)(attachment:2020-11-24_10-06.png)]

outfile = 'data1.csv'
x = np.genfromtxt(outfile,delimiter=',',names=True)
print(x)
print(type(x))
print(x.dtype)
print(x['id'],'\n')
print(x['value1'],'\n')
print(x['value2'],'\n')
print(x['value3'],'\n')

[(1., 123., 1.4, 23.) (2., 110., nan, 18.) (3.,  nan, 2.1, 19.)]

[('id', '

 
文本格式选项 
numpy.set_printoptions(precision=None,threshold=None,degeitems=None
 ,linewidth=None,suppress=None,nanstr=None,infstr=None,formatter=None
 ,sign=None,floatmod=None,**kwarg)Set printing options. precision:设置浮点精度，控制输出的小数点个数，默认为8.
threshold：概略显示，超过该值则以‘…’的形式来表示，默认是1000.当超过数据长度时对完整显示数据内容，当小于数据长度时，仅显示6个元素中间用“…”表示
linewidth：用于确定每行多少字符数后插入换行符，默认为75.
suppress：当suppress=True，表示小数不需要以科学技术法的形式输出，默认是False。
nanstr：浮点非数字的字符串表示形式，默认nan。
infstr：浮点无穷大的字符串表示形式，默认inf。
  
Three options determine the way floating point numbers,arrays and other Numpy objects are displayed. 
np.set_printoptions(precision=4)
x = np.array([1.123456789])
print(x)# [1.1235]
np.set_printoptions(threshold=20)
x = np.arange(50)
print(x) # [ 0 1 2 ... 47 48 49]
np.set_printoptions(threshold=np.iinfo(np.int).max)
print(x)
# [ 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
# 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47
# 48 49]
eps = np.finfo(float).eps
x = np.arange(4.)
x = x ** 2 - (x + eps) ** 2
print(x)
# [‐4.9304e‐32 ‐4.4409e‐16 0.0000e+00
# 0.0000e+00]
np.set_printoptions(suppress=True)
print(x) # [‐0. ‐0. 0. 0.]
x = np.linspace(0, 10, 10)
print(x)
# [ 0.
# 1.1111 2.2222 3.3333 4.4444 5.5556 6.6667 7.7778
# 8.8889
# 10.
# ]
np.set_printoptions(precision=2, suppress=True, threshold=5)
print(x)
# [ 0. 1.11 2.22 ... 7.78 8.89 10. ] 
[1.1235]
[ 0  1  2 ... 47 48 49]
[ 0  1  2  3  4  5  6  7  8  9 10 11 12 13 14 15 16 17 18 19 20 21 22 2324 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 4748 49]
[-0. -0.  0.  0.]
[-0. -0.  0.  0.]
[ 0.      1.1111  2.2222  3.3333  4.4444  5.5556  6.6667  7.7778  8.888910.    ]
[ 0.    1.11  2.22 ...  7.78  8.89 10.  ]
 
numpy.get_printoptions() Return the current print options. 
x = np.get_printoptions()
print(x) 
{'edgeitems': 3, 'threshold': 5, 'floatmode': 'maxprec', 'precision': 2, 'suppress': True, 'linewidth': 75, 'nanstr': 'nan', 'infstr': 'inf', 'sign': '-', 'formatter': None, 'legacy': False}
                        
                        
本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场，不承担相关法律责任。如若转载，请注明出处。 如若内容造成侵权/违法违规/事实不符，请点击【内容举报】进行投诉反馈！



                    



                    

    收藏
    



                    
    
        
        标签：技术
        
    

    
        
                
            上一篇 >
            【异常检测】异常分数计算（附代码）
        
                
            下一篇 >
            mysql load data csv_MySQL LOAD DATA INFILE—从文件（csv、txt）批量导入数据
        
                
    



                    
    
        
        
            相关文章
        
                
            Duilib中list控件支持ctrl和shif多行选中的实现
        
                
            [ICML2015]Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shif
        
                
            win10系统 微软输入法 于eclipse ctrl+shif+f冲突间接处理办法
        
                
            Codeforces Round #259 (Div. 2) B. Little Pony and Sort by Shif
        
                
            读LDD3，内存映射与DMA--PAGE_SHIF…
        
                
            VMware虚拟机安装XP【要先分区，再设置BOOT 启动CD，shif+上移】
        
                
            更换iBus五笔的左与右Shif
        
                
            sublime ctrl+shif+f 没用解决办法
        
                
            idea 对 ctrl + z 的撤销 是 ctrl + shif + z
        
                
            计算机最早的设计师应用于,计算机应用基础选择题doc.doc
        
                
            win10自带截图神器：Win+Shift+S
        
                
            Python基础之文件目录操作
        
                
            python简述目录_Python基础之文件目录操作(示例代码)
        
                
            tp5 如何做数据采集
        
                
            任务2-7(服务器字体+阿里巴巴矢量库)
        
                
            html标签（1)：h1~h6,p,br,pre,hr
        
                
            TI 电量计介绍与芯片选型指南
        
                
            几款TI电源芯片简介
        
                
            TI DSP芯片C2000系列读取FLASH数据
        
                
            德州仪器(Ti)平台嵌入式开发基础
        
                
            TI三相电机智能栅极驱动芯片特点分类
        
                
            省选模拟（12.08） T3 圈圈圈圈圈圈圈圈
        
                
            Hadoop生态圈技术栈（上）
        
                
            大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之6.Impala交互式查询
        
                
            小猿圈之Linux下Mysql 操作命令
        
                
            大数据Hadoop生态圈常用面试题
        
                
            大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之4.Hive DDL、DQL和数据操作
        
                
            备战Noip2018模拟赛11（B组）T3 Monogatari 物语
        
                
            【智能优化算法-圆圈搜索算法】基于圆圈搜索算法Circle Search Algorithm求解单目标优化问题附matlab代码
        
                
            NYOJ 78 圈水池
        
                
            递归问题 跑道 汽车 绕圈问题 Python实现
        
                
            Hadoop生态圈（三）：MapReduce



        
            


            

    
        内容推荐
    
    
                
            
                1
            
            
                大厂出品！保姆级教程帮你掌握「用户体验要素」
            
        
                
            
                2
            
            
                大厂实战案例！设计师如何助力京东快递业务增长？
            
        
                
            
                3
            
            
                总监干货！5个常见的UI设计规范创建误区
            
        
                
            
                4
            
            
                数据库管理利器——Navicat Premium v17.0.4学习版(Windows+MacOS+Linux)
            
        
                
            
                5
            
            
                进阶必学！快速掌握10种国际主流设计模型
            
        
                
            
                6
            
            
                春节期间，10个大厂的产品细节走心设计
            
        
                
            
                7
            
            
                如何帮助用户度过新人期？来看雪球APP的实战总结！
            
        
                
            
                8
            
            
                Sketch 95.3最新版下载 (Sketch矢量绘图应用软件)
            
        
                
            
                9
            
            
                Axure RP 9 最新正式版安装软件与汉化语言包下载(2023年3月30日更新)
            
        
                
            
                10
            
            
                嘘！SaaS产品的差异化设计细节，一般人我不告诉他
            
        
            




    





    
    
        最新更新
    
    
        
                        
                [产品经理]
                3分钟绘制流程图！这个AI+绘图工具的神仙组合，学完老板直呼内行
            
                        
                [产品经理]
                商业潜规则：打败你的不是AI，而是人性
            
                        
                [产品设计]
                DeepSeek+智能派单系统的实践分享
            
                        
                [产品经理]
                一文读懂本年实际损益借(贷)方发生额
            
                        
                [创业学院]
                大客户 vs 中小企业：需求竟天差地别？以企业培训数字化为例
            
                        
                [产品经理]
                不要将员工的“猴子”背到自己身上：职场管理中的权责划分
            
                        
                [产品经理]
                人工智能的三层架构：从应用层到基础服务层，解密智能革命
            
                        
                [产品设计]
                一文讲清楚iOS的SKAN4.0
            
                    
    
    



    
        热门标签
    
    
        
                         数量
                         AI技术趋势
                         用户角色
                         心智游移
                         自然生态系统
                         会员权益
                         AirDrop
                         hashmap
                         小龙虾
                         焦虑
                         危机处理
                         发展
                         微信群折叠
                         toast
                         测评新算法
                         改版
                         wireshark
                         投放方式
                         音频播放动效
                         timer
                         女性商业
                         古典自媒体
                         海外博主
                         repeater
                         转账
                         万能钥匙
                         秋招
                         快服务
                         个人演讲
                         客户共识