场景识别-ocr-分类-人物识别
person:识别出图片中有几个人(包括背影,半身等都计算在内)
class:分类,包括1000个分类
scenes:场景(包括1583个场景)
ocr:识别出图片中的文字