【实验】MySQL多少数据需要建立索引

2023-10-10 02:58:22

【实验】MySQL多少数据需要建立索引

数据准备

采用Python随机生成若干条数据，以备测试使用，代码如下

# db.py
import pymysql
# 默认数据返回的是二维列表：
# (
#     (每一行)
#     (每一行)
# )# 加上 cursor=pymysql.cursors.DictCursor后的数据返回格式：
# [{'psw': 'e10adc3949ba59abbe56e057f20f883e'}]class db:host = ""port = 3306user = "root"psw = ""db_name = "testdb"connect = Nonecursor = Nonedef __init__(self):self.connect = pymysql.connect(host=self.host,port=self.port,user=self.user,passwd=self.psw,db=self.db_name)self.cursor = self.connect.cursor(cursor=pymysql.cursors.DictCursor)passdef query(self,sql):connect = pymysql.connect(host=self.host,port=self.port,user=self.user,passwd=self.psw,db=self.db_name)cursor = connect.cursor(cursor=pymysql.cursors.DictCursor)cursor.execute(sql)data = cursor.fetchall()connect.close()return datadef operate(self,sql):# connect = pymysql.connect(host=self.host,port=self.port,user=self.user,passwd=self.psw,db=self.db_name)# cursor = connect.cursor(cursor=pymysql.cursors.DictCursor)try:self.cursor.execute(sql)self.connect.commit()self.count = self.cursor.rowcountreturn countexcept Exception as e:print(e)print(sql)return False

import db as db
import randommy_db = db.db()def get_vcode():v_code = chr(random.randint(65,90))v_code = v_code + chr(random.randint(97,122))v_code = v_code + chr(random.randint(65,90))v_code = v_code + chr(random.randint(48,57))v_code = v_code + chr(random.randint(65,90))v_code = v_code + chr(random.randint(48,57))return v_codeif __name__ == '__main__':for i in range(1,1000000):sql = "INSERT INTO `testdb`.`test_data_100w`(`data_1`, `data_2`, `data_3`) VALUES (%d, '%s', '%s')" % (i+1,get_vcode(),get_vcode())my_db.operate(sql)print("当前编号："+str(i))

数据格式

数据表

开始测试

一万条数据

索引前

一万条数据

索引后

在这里插入图片描述

性能提升0.001秒，可忽略不计~

十万条数据

索引前

在这里插入图片描述

索引后

在这里插入图片描述
速度提升：0.014秒，但是提升了8倍！

一百万条数据

索引前

百万条数据

索引后

百万条数据建立索引后
查询速度提升 0.14秒，71倍

3000W条数据

3000w

索引前

3000W索引前

索引后

建立索引所用时长：1673.908s 约27分钟！

3000W数据查询时长
速度提升：约4.2秒，1411倍

结论

因为MySQL本身已经非常优秀了，
在几万条数据的情况之下，索引的优势并不明显。
数据达到几十万条以后，索引的效果显著，能明显提升查询速度，数据量越大，索引越发重要。当数据量有了千万级别时，有无索引可导致性能相差千倍！

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场，不承担相关法律责任。如若转载，请注明出处。 如若内容造成侵权/违法违规/事实不符，请点击【内容举报】进行投诉反馈！

标签：技术

Duilib中list控件支持ctrl和shif多行选中的实现

[ICML2015]Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shif

win10系统微软输入法于eclipse ctrl+shif+f冲突间接处理办法

Codeforces Round #259 (Div. 2) B. Little Pony and Sort by Shif

读LDD3，内存映射与DMA--PAGE_SHIF…

VMware虚拟机安装XP【要先分区，再设置BOOT 启动CD，shif+上移】

更换iBus五笔的左与右Shif

sublime ctrl+shif+f 没用解决办法

idea 对 ctrl + z 的撤销是 ctrl + shif + z

计算机最早的设计师应用于,计算机应用基础选择题doc.doc

win10自带截图神器：Win+Shift+S

Python基础之文件目录操作

python简述目录_Python基础之文件目录操作(示例代码)

tp5 如何做数据采集

任务2-7(服务器字体+阿里巴巴矢量库)

html标签（1)：h1~h6,p,br,pre,hr

TI 电量计介绍与芯片选型指南

几款TI电源芯片简介

TI DSP芯片C2000系列读取FLASH数据

德州仪器(Ti)平台嵌入式开发基础

TI三相电机智能栅极驱动芯片特点分类

省选模拟（12.08） T3 圈圈圈圈圈圈圈圈

Hadoop生态圈技术栈（上）

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之6.Impala交互式查询

小猿圈之Linux下Mysql 操作命令

大数据Hadoop生态圈常用面试题

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之4.Hive DDL、DQL和数据操作

备战Noip2018模拟赛11（B组）T3 Monogatari 物语

【智能优化算法-圆圈搜索算法】基于圆圈搜索算法Circle Search Algorithm求解单目标优化问题附matlab代码

NYOJ 78 圈水池

递归问题跑道汽车绕圈问题 Python实现

Hadoop生态圈（三）：MapReduce

【实验】MySQL多少数据需要建立索引

【实验】MySQL多少数据需要建立索引

数据准备

数据格式

开始测试

一万条数据

索引前

索引后

十万条数据

索引前

索引后

一百万条数据

索引前

索引后

3000W条数据

索引前

索引后

结论

相关文章