Vision-text
文本的识别定位通过预训练模型dbnet和crnn参考以下工程,对移动端的场景做了部分参数和模型的调整
通过Http协议请求,参数"image"表示图像文件在"capture"下的路径
curl -H "Content-Type:application/json" -X POST
--data '{"image":"image_1.png"}' http://localhost:9092/vision/text服务返回
{
"code":0,
"data":[
{
"pos": [100,200], #表示可点击的坐标
"text": "用户使用说明" #图像解析到的文本内容
},{
"pos": [300,500],
"text": "同意"
}
]
}