本篇内容介绍了“如何解决数据库删除完全重复和部分关键字段重复”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!
1、第一种重复很容易解决,不同数据库环境下方法相似:
以下为引用的内容:
Mysql
createtabletmpselectdistinct*fromtableName;
droptabletableName;
createtabletableNameselect*fromtmp;
droptabletmp;
SQLServer
selectdistinct*into#TmpfromtableName;
droptabletableName;
select*intotableNamefrom#Tmp;
droptable#Tmp;
Oracle
createtabletmpasselectdistinct*fromtableName;
droptabletableName;
createtabletableNameasselect*fromtmp;
droptabletmp;
发生这种重复的原因是由于表设计不周而免费主机域名产生的,增加唯一索引列就可以解决此问题。
2、此类重复问题通常要求保留重复记录中的第一条记录,操作方法如下。假设有重复的字段为Name,Address,要求得到这两个字段唯一的结果集
Mysql
以下为引用的内容:
altertabletableNameaddautoIDintauto_incrementnotnull;
createtabletmpselectmin(autoID)asautoIDfromtableNamegroupbyName,Address;
createtabletmp2selecttableName.*fromtableName,tmpwheretableName.免费主机域名autoID=tmp.autoID;
droptabletableName;
renametabletmp2totableName;
SQLServer
selectidentity(int,1,1)asautoID,*into#TmpfromtableName;
selectmin(autoID)asautoIDinto#Tmp2from#TmpgroupbyName,Address;
droptabletableName;
select*intotableNamefrom#TmpwhereautoIDin(selectautoIDfrom#Tmp2);
droptable#Tmp;
droptable#Tmp2;
Oracle
DELETEFROMtableNamet1WHEREt1.ROWID>(SELECTMIN(t2.ROWID)FROMtableNamet2WHEREt2.Name=t1.Nameandt2.Address=t1.Address);
说明:
1.MySQL和SQLServer中最后一个select得到了Name,Address不重复的结果集(多了一个autoID字段,在大家实际写时可以写在select子句中省去此列)
2.因为MySQL和SQLServer没有提供rowid机制,所以需要通过一个autoID列来实现行的唯一性,而利用Oracle的rowid处理就方便多了。而且使用ROWID是最高效的删除重复记录方法。
“如何解决数据库删除完全重复和部分关键字段重复”的内容就介绍到这里了,感谢大家的阅读。如果想了解更多行业相关的知识可以关注云技术网站,小编将为大家输出更多高质量的实用文章!
这篇文章主要讲解了“Hive内部表和外部表有什么区别”,文中的讲解内容简单清晰,易于学习与理解,下面请大家跟着小编的思路慢慢深入,一起来研究和学习“Hive内部表和外部表有什么区别”吧!内部表数据由Hive自身管理,外部表数据由HDFS管理; 内部表数据存储的…