知识屋：更实用的电脑技术知识网站

知识屋手机游戏手机软件电脑软件最近更新手机端

冒险村物语英雄无敌3塔防驾考家园手游

所在位置：首页 > 操作系统 > linux

Linux下删除大数据文件中部分字段重复行的方法

发布时间：2014-05-22 17:04:57作者：知识屋

最近写的一个数据采集程序生成了一个含有1千多万行数据的文件，数据由4个字段组成，按照要求需要删除第二个字段重复的行，找来找去linux下也没找到合适的工具，sed/gawk等流处理工具只能针对一行一行处理，并无法找到字段重复的行。看来只好自己python一个程序了，突然想起来利用mysql，于是进行乾坤大挪移：

1. 利用mysqlimport --local dbname data.txt导入数据到表中，表名要与文件名一致
2. 执行下列sql语句(要求唯一的字段为uniqfield）

复制代码

代码如下:

use dbname;
alter table tablename add rowid int auto_increment not null;
create table t select min(rowid) as rowid from tablename group by uniqfield;
create table t2 select tablename .* from tablename,t where tablename.rowid= t.rowid;
drop table tablename;
rename table t2 to tablename;

（免责声明：文章内容如涉及作品内容、版权和其它问题，请及时与我们联系，我们将在第一时间删除内容，文章内容仅供参考）

收藏

上一篇:linux中去掉文件重复数据行的方法(去重复ip)

下一篇:Linux中限制用户访问权限的3种方法

知识阅读

软件推荐

游戏推荐

精选栏目

热门推荐

人气文章
最新文章

1
专为国人订制！Linux Deepin新版发布
2012-07-10

1
专为国人订制！Linux Deepin新版发布
2
CentOS 6.3安装(详细图解教程)
2012-08-08

2
CentOS 6.3安装(详细图解教程)
3
Linux怎么查看网卡驱动?Linux下查看网卡的驱动程序
2014-02-25

3
Linux怎么查看网卡驱动?Linux下查看网卡的驱动程序
4
centos修改主机名命令
2014-09-05

4
centos修改主机名命令
5
Ubuntu或UbuntuKyKin14.04Unity桌面风格与Gnome桌面风格的切换
2014-05-15

5
Ubuntu或UbuntuKyKin14.04Unity桌面风格与Gnome桌面风格的切换
6
FEDORA 17中设置TIGERVNC远程访问
2012-08-11

6
FEDORA 17中设置TIGERVNC远程访问
7
StartOS 5.0相关介绍，新型的Linux系统！
2012-08-08

7
StartOS 5.0相关介绍，新型的Linux系统！
8
解决vSphere Client登录linux版vCenter失败
2012-07-09

8
解决vSphere Client登录linux版vCenter失败
9
LINUX最新提权 Exploits Linux Kernel <= 2.6.37
2011-02-27

9
LINUX最新提权 Exploits Linux Kernel <= 2.6.37
10
nginx在网站中的7层转发功能
2014-09-05

10
nginx在网站中的7层转发功能

下载排行榜
热门排行榜

1
《奇迹之剑手游》
角色扮演
下载

1
《奇迹之剑手游》
角色扮演
2
海岛奇兵
角色扮演
下载

2
海岛奇兵
角色扮演
3
《守望黎明手游》
战争策略
下载

3
《守望黎明手游》
战争策略
4
一人之下手游
角色扮演
下载

4
一人之下手游
角色扮演
5
《阿瓦隆之王手游》
战争策略
下载

5
《阿瓦隆之王手游》
战争策略
6
傲世飞仙手游
角色扮演
下载

6
傲世飞仙手游
角色扮演
7
《少年三国志2 手游》
卡牌对战
下载

7
《少年三国志2 手游》
卡牌对战
8
《太古封魔录2》
角色扮演
下载

8
《太古封魔录2》
角色扮演
9
荒野乱斗
枪战射击
下载

9
荒野乱斗
枪战射击
10
《青云传》
角色扮演
下载

10
《青云传》
角色扮演

手机游戏

手机软件

电脑软件

猜你喜欢

影音联机通讯社交仙侠摄像投注唱歌购物导航生活角色扮演直播个人借贷恋爱学习 RPG 3D 二次元奇迹英语口语区块链抢红包舞蹈吃鸡不上征信手机赚钱摄影趣味战国关卡钱包低息策略放置手机美化传奇角色音乐抖音儿童回合沙盒小说母婴资讯财经街机射击模拟

本站所有软件来自互联网，版权归原著所有。如有侵权，敬请来信告知，我们将及时撤销。

知识屋 www.zhishiwu.com 更实用的电脑技术知识网站

苏ICP备14019037号-7