i otomatik olarak gelen e-postaları ayrıştırma ve onlardan bir veritabanı yerleştirmek için bir sistem inşa ediyorum
başlangıçta sadece gelen 10-20 beklenen formatları olacak, ancak uzun vadeli farklı biçimlerde binlerce olasılığı var
onu görüyorum yolu
- i (örneğin, konu satırında regex) e-posta biçimini tanımlamak gerekir
- Doğru işlemci ile e-posta ayrıştırmak
- veri gerçekçi olup olmadığını kontrol edin, belki manuel kontrol için bazı bayrak
- veritabanı doldurmak
Sonra ben bu yapısı nasıl öneriler olduğunu, örneğin i sisteminin esnek olması gerekir, veritabanı veya düz dosya biçimlerini muhafaza ederim, bu konu hat algılama olabilir yeterli değildir ve ben de taramak zorunda kalabilirsiniz e-posta başlıklarını.
veri kendisi e-posta vücudunun veya pdf olarak ekleri olabilir, dosyaları vb excel
şey bu tür bir örnektir belirli bir e-posta adresine fotoğrafları e-posta picasa fotoğraf galerisi seviyor ve otomatik olarak bunları ayıklar ve sizin için bir galeride koyar