@致力于文化传播给企业带来的价值

相机的Exif信息会导致计算机视觉模型效果不佳?

341
发表时间:2019-10-10 16:40作者:成名来源:搜狐科技网址:http://www.dakaruanwen.com

在开发和使用计算机视觉(CV)模型的过程中,由于NumPy、TensorFlow和电脑上的图片查看器在处理Exif上存在着差异,让这个问题变得十分隐秘。

Adam是一位知名的机器学习课程博主,他的博客内容非常实用,几乎篇篇都能收获上千赞,足见其受欢迎的程度。


他在最新的文章中指出了CV模型在处理Exif存在的缺失,以及补救方法,下面是他文章的主要内容。

Exif信息害死人

普通智能手机或者相机拍照时,如果手持方向发生变化,内部的重力感应器件会告诉设备,照片究竟哪个边是向上的。

当我们在手机、相机或者电脑的Photoshop软件上查看照片时,完全没有问题,就像这样:



然而眼见并非为实,实际图像的像素数据不会旋转。这是由于图像传感器是对连续的像素信息流进行逐行读取,因此你无论纵向和横向握持相机,图像都是按照一个方向进行存储。

那么拍照设备和电脑为什么就能按照正确的方向显示图片呢?这是因为照片里还保存着一组元数据,称之为Exif,即可交换图像文件格式(Exchangeable image file format)。

Exif中包含着照片的像素数、焦距、光圈等信息,其中还有一个方向(Orientation)的数据。

上图中Orientation一项的参数是Rotate 90 CW,意思是图像在显示前需要顺时针旋转90度。如果图片查看程序没有执行此操作,你就只能拧着脖子看了。

Exif原先是用在TIFF图像格式上,后来才加入到JPEG图像格式中,而图像数据集中的图片大多是JPEG格式。

一些程序为了保持向后兼容性,不会去解析Exif数据。大多数用于处理图像数据的Python库(如NumPy、SciPy,TensorFlow,Keras等)就是这样的。

这意味着当你使用这些工具导入图像时,都将获得原始的未旋转图像数据。如果把这些侧躺着或上下颠倒的图像输入到CV模型中,会得到错误的检测结果。

这个问题看起来很愚蠢,似乎初学者会犯这样的低级错误。但事实并非如此!甚至连Google云上的视觉API Demo也无法正确处理Exif方向问题:

如果我们把图像旋转到正确的方向再上传,检测的结果与上图相比将完全改变:

当我们在电脑上查看图片时完全没问题,但是一用到模型中就不正常。因此很难发现问题的所在。

这也导致一些开发者在Github上提问,抱怨他们正在使用的开源项目已损坏,或是模型不够准确。但是实际上问题要简单得多,只是图片的方向错了!

解决方法

解决以上问题的方法就是,在导入图像时检查它们的Exif数据,在必要时旋转图像。Adam已经写好了一段代码:

importPIL.Image

importPIL.ImageOps

importnumpy asnp

defexif_transpose(img):

ifnotimg:

returnimg

exif_orientation_tag = 274

# Check for EXIF data (only present on some files)

ifhasattr(img, "_getexif") andisinstance(img._getexif, dict) andexif_orientation_tag inimg._getexif:

exif_data = img._getexif

orientation = exif_data[exif_orientation_tag]

# Handle EXIF Orientation

iforientation == 1:

# Normal image - nothing to do!

pass

eliforientation == 2:

# Mirrored left to right

img = img.transpose(PIL.Image.FLIP_LEFT_RIGHT)

eliforientation == 3:

# Rotated 180 degrees

img = img.rotate( 180)

eliforientation == 4:

# Mirrored top to bottom

img = img.rotate( 180).transpose(PIL.Image.FLIP_LEFT_RIGHT)

eliforientation == 5:

# Mirrored along top-left diagonal

img = img.rotate( -90, expand= True).transpose(PIL.Image.FLIP_LEFT_RIGHT)

eliforientation == 6:

# Rotated 90 degrees

img = img.rotate( -90, expand= True)

eliforientation == 7:

# Mirrored along top-right diagonal

img = img.rotate( 90, expand= True).transpose(PIL.Image.FLIP_LEFT_RIGHT)

eliforientation == 8:

# Rotated 270 degrees

img = img.rotate( 90, expand= True)

returnimg

defload_image_file(file, mode='RGB'):

# Load the image with PIL

img = PIL.Image.open(file)

ifhasattr(PIL.ImageOps, 'exif_transpose'):

# Very recent versions of PIL can do exit transpose internally

img = PIL.ImageOps.exif_transpose(img)

else:

# Otherwise, do the exif transpose ourselves

img = exif_transpose(img)

img = img.convert(mode)

returnnp.array(img)

加入以上代码后,就可以正确地将图像导入Keras或TensorFlow了。

如果觉得麻烦,Adam还把上面的代码打包好了,在GitHub上这个项目叫做image_to_numpy。一行代码就可以完成安装:

pip3 install image_to_numpy

以后,你在自己的Python代码中加入这样几句即可。

importmatplotlib.pyplot asplt

importimage_to_numpy

# Load your image file

img = image_to_numpy.load_image_file( "my_file.jpg")

# Show it on the screen (or whatever you want to do)

plt.imshow(img)

plt.show

大咖软文网:为中小企业提供优质全方位软文营销服务,努力打造软文发布数字化营销传播平台,致力于文化传播给企业带来的价值!

工作时间

周一至周五:8:30-20:00

周六至周日:8:30-18:00


联系电话:15919903290

电子邮箱:601620908@qq.com



 新手上路
帮助中心
淘宝店铺        
服务咨询
快速通道
快速登录
免费注册,超低价格发稿推广
在线客服
 
 
——————
销售经理
15919903290