主頁(yè) > 知識(shí)庫(kù) > mysql數(shù)據(jù)庫(kù)刪除重復(fù)數(shù)據(jù)只保留一條方法實(shí)例

mysql數(shù)據(jù)庫(kù)刪除重復(fù)數(shù)據(jù)只保留一條方法實(shí)例

熱門標(biāo)簽:武漢網(wǎng)絡(luò)外呼系統(tǒng)服務(wù)商 外呼系統(tǒng)打電話上限是多少 啥是企業(yè)400電話辦理 曲靖移動(dòng)外呼系統(tǒng)公司 怎樣在地圖標(biāo)注銷售區(qū)域 電話外呼系統(tǒng)改號(hào) 地圖標(biāo)注費(fèi)用是多少 百應(yīng)電話機(jī)器人優(yōu)勢(shì) 南昌三維地圖標(biāo)注

1.問(wèn)題引入

假設(shè)一個(gè)場(chǎng)景,一張用戶表,包含3個(gè)字段。id,identity_id,name。現(xiàn)在身份證號(hào)identity_id和姓名name有很多重復(fù)的數(shù)據(jù),需要?jiǎng)h除只保留一條有效數(shù)據(jù)。

2.模擬環(huán)境

1.登入mysql數(shù)據(jù)庫(kù),創(chuàng)建一個(gè)單獨(dú)的測(cè)試數(shù)據(jù)庫(kù)mysql_exercise

create database mysql_exercise charset utf8;

2.創(chuàng)建用戶表users

create table users(
					id int auto_increment primary key,
					identity_id varchar(20),
					name varchar(20) not null
     );

3.插入測(cè)試數(shù)據(jù)

insert into users values(0,'620616199409206512','張三'),
						(0,'620616199409206512','張三'),
						(0,'62062619930920651X','李四'),
						(0,'62062619930920651X','李四'),
						(0,'620622199101206211','王五'),
						(0,'620622199101206211','王五'),
						(0,'322235199909116233','趙六');

可以多執(zhí)行幾次,生成較多重復(fù)數(shù)據(jù)。

4.解決思路

(1)根據(jù)身份證號(hào)和name進(jìn)行分組;

(2)取出分組后的最大id(或最小id);

(3)刪除除最大(或最?。﹊d以外的其他字段;

5.第一次嘗試(失敗!!!)

delete from users where id not in (select max(id) from users group by identity_id,name);

報(bào)錯(cuò):

1093 (HY000): You can't specify target table 'users' for update in FROM clause

因?yàn)樵贛YSQL里,不能先select一個(gè)表的記錄,再按此條件進(jìn)行更新和刪除同一個(gè)表的記錄。

解決辦法是,將select得到的結(jié)果,再通過(guò)中間表select一遍,這樣就規(guī)避了錯(cuò)誤,

這個(gè)問(wèn)題只出現(xiàn)于mysql,mssql和oracle不會(huì)出現(xiàn)此問(wèn)題。

所以我們可以先將括號(hào)里面的sql語(yǔ)句先拿出來(lái),先查到最大(或最小)id。

select max_id from (select max(id) as max_id from users group by identity_id,name);

接著,又報(bào)錯(cuò)了!?。?/strong>

ERROR 1248 (42000): Every derived table must have its own alias

意思是說(shuō):提示說(shuō)每一個(gè)衍生出來(lái)的表,必須要有自己的別名!

執(zhí)行子查詢的時(shí)候,外層查詢會(huì)將內(nèi)層的查詢當(dāng)做一張表來(lái)處理,所以我們需要給內(nèi)層的查詢加上別名

繼續(xù)更正:

給查詢到的最大(或最小id)結(jié)果當(dāng)做一張新的表,起別名t,并查詢t.mix_id。

select t.max_id from (select max(id) as max_id from users group by identity_id,name) as t;

可以成功查到最大(或最?。﹊d了,如下圖:

6.第二次嘗試(成功?。。。?/strong>

delete from users where id not in (
		select t.max_id from 
		(select max(id) as max_id from users group by identity_id,name) as t
		);

執(zhí)行結(jié)果:

成功將重復(fù)的數(shù)據(jù)刪除,只保留了最后一次增加的記錄。同理也可以保留第一次添加的記錄(即刪除每個(gè)分組里面除最小id以外的其他條記錄)

3.知識(shí)拓展一:更新數(shù)據(jù)

其他場(chǎng)景應(yīng)用:要將用戶表user_info里名字(name)為空字符串("")的用戶的狀態(tài)(status)改成"0"

update user_info set status='0' where user_id in (select user_id from user_info where name='')

同樣報(bào)了如下錯(cuò)誤:

You can't specify target table ‘user_info' for update in FROM clause

因?yàn)樵贛YSQL里,不能先select一個(gè)表的記錄,再按此條件進(jìn)行更新和刪除同一個(gè)表的記錄,解決辦法是,將select得到的結(jié)果,再通過(guò)中間表select一遍,這樣就規(guī)避了錯(cuò)誤。
以下兩種均可?。。?/p>

update user_info set status='0' where user_id in 
	 (select user_id from (select user_id from user_info where name = '') t1);

下面這種也可,細(xì)微差別,別名可帶as可不帶,t1.user_id 直接和內(nèi)層的user_id對(duì)應(yīng)也可以。

update user_info set status='0' where user_id in 
	(select t1.user_id from (select user_id from user_info where name='') as t1);

3.1 分步驟解析

(1)將以下查詢結(jié)果作為中間表:

select user_id from user_info where name='';

(2)再查詢一遍中間表作為結(jié)果集:

select user_id from (select user_id from user_info where name='') as t;

(3)更新數(shù)據(jù)

update user_info set status='0' where user_id in 
	(select user_id from (select user_id from user_info where name='') as t1);

4.拓展練習(xí):刪除重復(fù)數(shù)據(jù)

編寫一個(gè) SQL 查詢,來(lái)刪除 Person 表中所有重復(fù)的電子郵箱,重復(fù)的郵箱里只保留 Id 最小 的那個(gè)。

+----+------------------+
| Id | Email      |
+----+------------------+
| 1 | john@example.com |
| 2 | bob@example.com |
| 3 | john@example.com |
+----+------------------+

Id 是這個(gè)表的主鍵。

例如,在運(yùn)行你的查詢語(yǔ)句之后,上面的 Person 表應(yīng)返回以下幾行:

+----+------------------+
| Id | Email      |
+----+------------------+
| 1 | john@example.com |
| 2 | bob@example.com |
+----+------------------+

解答一:

delete from Person where Id not in (
	select t.min_id from (
		select min(Id) as min_id from Person group by Email
		) as t
	);

解答二:

delete p1 from 
	Person as p1,Person as p2 
		where p1.Email=p2.Email and p1.Id > p2.Id;

總結(jié)

到此這篇關(guān)于mysql數(shù)據(jù)庫(kù)刪除重復(fù)數(shù)據(jù)的方法只保留一條的文章就介紹到這了,更多相關(guān)mysql刪除重復(fù)數(shù)據(jù)內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • MyBatis批量插入/修改/刪除MySql數(shù)據(jù)
  • mysql利用mysqlbinlog命令恢復(fù)誤刪除數(shù)據(jù)的實(shí)現(xiàn)
  • mysql5.7.33誤刪除ibdata文件找回?cái)?shù)據(jù)的方法
  • mysql 大表批量刪除大量數(shù)據(jù)的實(shí)現(xiàn)方法
  • 淺談為什么MySQL不建議delete刪除數(shù)據(jù)
  • Python批量刪除mysql中千萬(wàn)級(jí)大量數(shù)據(jù)的腳本分享
  • Mysql刪除數(shù)據(jù)以及數(shù)據(jù)表的方法實(shí)例
  • MySQL刪除數(shù)據(jù),表文件大小依然沒(méi)變的原因
  • MySQL 快速刪除大量數(shù)據(jù)(千萬(wàn)級(jí)別)的幾種實(shí)踐方案詳解
  • MySQL Delete 刪數(shù)據(jù)后磁盤空間未釋放的原因

標(biāo)簽:甘南 荊州 隨州 錦州 黑河 滄州 資陽(yáng) 吉林

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《mysql數(shù)據(jù)庫(kù)刪除重復(fù)數(shù)據(jù)只保留一條方法實(shí)例》,本文關(guān)鍵詞  mysql,數(shù)據(jù)庫(kù),刪除,重復(fù),;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《mysql數(shù)據(jù)庫(kù)刪除重復(fù)數(shù)據(jù)只保留一條方法實(shí)例》相關(guān)的同類信息!
  • 本頁(yè)收集關(guān)于mysql數(shù)據(jù)庫(kù)刪除重復(fù)數(shù)據(jù)只保留一條方法實(shí)例的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章