VISHAM-KG 是一个多模态框架,通过对齐文本和视觉实体,构建印地语视觉文档中的知识图谱。它结合了基于规则的语言分析和计算机视觉技术,在资源匮乏的印度语环境中生成主语-关系-宾语三元组。
Access restricted. Please log in or start a trial to view this content.
Access restricted. Please log in or start a trial to view this content.
Access restricted. Please log in or start a trial to view this content.
Access restricted. Please log in or start a trial to view this content.
| Name | Company | Catalog Number | Comments |
|---|---|---|---|
| BiLSTM-CRF与印度NER模型 | 定制训练 | PyTorch | 命名实体识别 |
| CLIP-ViT-B/32 | 2022-09 | OpenAI | 可视化嵌入生成 |
| 中央处理器 | 英特尔i9 | 英特尔 | 通用计算 |
| EasyOCR | v1.7.1 | Jaided AI | 从图像中提取印地语文本 |
| GPU | NVIDIA RTX 3090 | NVIDIA | 模型推理加速 |
| 印地语儿童故事 | 10层 | 策划数据集 | 评估语料库 |
| Neo4j | v5.13 | Neo4j 公司 | 知识图谱存储 |
| 数字派 | v1.24 | NumPy 社区 | 数值计算 |
| 熊猫 | 2.0版本 | 熊猫社区 | 数据处理 |
| 蟒蛇 | v3.10 | Python 软件基础 | 流水线实现 |
| PyTorch | 2.0版本 | 元人工智能 | 深度学习框架 |
| Stanza(印地语模式) | v1.6.1 | 斯坦福国家语言物理学 | POS 标记与依赖解析 |
| XLM-R(基础版) | 2023-05 | 拥抱脸 | 文本嵌入生成 |
| YOLOv8 | v8.0.208 | 超溶菌 | 视觉对象检测 |
Access restricted. Please log in or start a trial to view this content.
Request permission to reuse the text or figures of this JoVE article
Request Permission