对海量视频画面中出现的场景、物品、商标、人脸、表情、动作、行为、对话进行自动高效精准识别,并在此基础上充分利用跨模态信息的优势打通感知到认知的跨越

A new video content recognition engine

新一代视频内容识别引擎
围绕视觉、文字、语音多模态信息的时空语义对齐和认知协同计算的关键技术,重点围绕跨模态视频内容检索和短视频内容生产应用,在视频平台全面部署。

应用场景一:跨模态内容检索

应用场景二:短视频内容创作

应用场景三:商品个性化描述自动生成

Identify scale

识别规模

Core recognition capacity

核心识别能力

人脸/表情识别

FACE RECOGNITION

多角度人脸/表情识别,国内外上千明星资源库,多种人脸表情识别标签,精准捕捉人物情绪

物体识别

OBJECT RECOGNITION

精细化物体识别类型,包含汽车、3C、日化、快消、服饰等多达上千类识别库

场景识别

SCENE RECOGNITION

通过视频画面中多维物体组合,识别所在画面的静态场景,例如交通、家居、办公等, 让智能识别引擎更理解视频的深度内容。

行为识别

BEHAVIOR RECOGNITION

通过识别优势画面中的人与物体,人与场景的关联,从而获得更深一层意义的识别内容。 例如亲子互动、恋人互动、日常生活等。

商标识别

TRADEMARK RECOGNITION

主流物体的商标识别,在识别商品的基础上辨识产品的品牌,便于更精准的商业化服务

SOLUTION

解决方案

为教育领域提供实时视频识别能力,用于辅助提升教学效率和教学质量分析,同时对海量的教育视频资源进行智能化的识别,提取关键的知识点,生产出各类点视频知识片段剪辑。

教育行业

EDUCATIONAL SERVICES

通过人脸、行为动作、表情等多种识别能力等组合,实时分析赛事视频内容,高效标准化的生成各类精彩片段,并对视频识别数据进行分类保存方便采编播人员的使用。

体育赛事

SPORTS EVENTS

根据客户定制化需求,对海量视频内容进行智能审核,对敏感人物、标语、符号、对话等画面出现的内容自动化进行标注和自动剔除。

内容审核

CONTENT REVIEW