Tamam. Lütfen benimle ayı, ben şeyler açıklayan beceremiyoruz.
Bir web sitesinde bir form aracılığıyla toplanan iletişim bilgilerinin bir veritabanı var. Açıkçası, insanlar daha yanlışlıkla birden göndermek basın (ya da bilerek, ama sabitleme farklı bir konudur) yani yinelenen satırları bir LOT bu veritabanında vardır.
Yani, tablo1 gibi iletişim bilgilerini tutar:
ID | date | unique ID code | first name, blah blah
1 stuff 20110101ba78b joe
Ve table2 gibi, benzersiz kimlik kodu alanına katıldı ilgili verileri tutar:
ID | data | unique ID code
1 a 20110101ba78b
2 b 20110101ba78b
Yani, table2 her kişi için birden fazla değer tutar. Bu tablonun yapısı (ve tablo2 yaklaşık bir milyon satır vardır, bu yüzden ben değil şu anda yapısını değiştirmek istemiyorum).
Yani benim ikilem şudur: Ben bu geçici bir tablo yapmak ve (tüm alanlar) SELECT DISTINCT kolay biliyorum, ama ben yinelenen satırları en az 1 benzersiz Kimlik alanını tutmak istiyorum. Ama benzersiz kimlik alanını tutarsanız, diğer veri böylece DISTINCT (tüm alanlar) çalışmaz, her satır tutacak SEÇ tam olarak aynı olsa bile, her satır için benzersiz olduğunu. Umarım iyice bu açıkladı. Gerekirse daha fazla bilgi için lütfen bana sor.
EDIT: Ben her tablo için kimlik alanının kurtulmak olabilir emin değilim, ama bana kalırsa orada olmak var .... sadece bulunuyor.