智慧城市/空间

Linker Vision 借助视觉 AI 优化城市运营

高雄市政府

目标

Linker Vision 提供以数据为核心的计算机视觉解决方案，这些解决方案经过优化，能够实现视觉 AI 应用从云端到边缘的快速部署与高效扩展。高雄是台湾最大的城市之一，也是 Linker Vision 重要的最终客户之一。他们借助 NVIDIA Metropolis 实施了先进的智慧城市解决方案，以解决部门各自为政带来的关键城市挑战。这些分散的政府基础设施使得快速有效地共享重要信息变得极其困难，阻碍了对全市问题的协调应对。LLinker Vision 采用 NVIDIA 的三大计算平台——基于 NVIDIA Omniverse™ 进行数字孪生仿真，采用 NVIDIA NeMo™ Curator 训练 AI 模型，以及借助 NVIDIA 视频搜索与总结 (VSS) AI Blueprint 部署 AI 智能体——为城市赋能，使其具备更出色的态势感知能力，以及基于数据做出积极决策的能力。这也有助于打破组织孤岛，为真正的智慧城市奠定基础。

客户

高雄市

合作伙伴

Linker Vision

用例

计算机视觉 / 视频分析
仿真 / 建模 / 设计

产品

NVIDIA Metropolis
NVIDIA 视频搜索与总结 AI Blueprint
NVIDIA Omniverse Enterprise

使用 VSS Blueprint 构建可视化 AI 智能体，将开发工作量减少 85%。

响应时间缩短高达 80%，使应急服务能够更快到达现场。

支持利用视觉语言模型 (VLM) 快速生成事件报告，为风险级别评估提供更多细节。
使用 VLM 和 VSS blueprint 创建统一平台，以打破信息障碍并以最低成本实现最大效率。

借助视觉语言模型增强城市态势感知能力

在城市中应用视觉 AI 的关键挑战之一是异常事件的高度多变性和不可预测性。传统的计算机视觉系统经过训练，可以检测汽车、建筑物或行人等标准对象，但往往难以解读整体态势或理解关键事件，例如交通事故、洪水或倒下的树木。

为了突破这一局限，Linker Vision 使用由生成式 AI 驱动的 VLM，通过解析视觉元素间的关联并生成对场景的描述性叙述，超越简单的物体检测。通过提示 VLM 对正在发生的情况进行描述，Linker Vision 的系统系统能够对复杂场景提供智能化的解释，从而帮助城市响应人和决策人实时掌握现场情况。这种方法显著提高了态势感知和响应效率，尤其是在瞬息万变、不可预测的城市环境中。

通过生成式 AI 与 VLM 的创新，我们致力于展现视觉 AI 在智慧城市发展中的巨大潜力。集成 NVIDIA 技术后，我们的解决方案正变得更高效、更具价值。与 NVIDIA 的合作印证了智能技术如何与城市愿景融合，创造具有深远影响力的变革。”

Linker Vision CTO 兼联合创始人 Willy Kuo

视频分析如何为更智能的互联城市基础设施提供动能

城市面临着一个关键的城市挑战：部门壁垒。长期以来，不同的市政部门（例如水利局与交通局）在由不同系统集成商 (SI) 和供应商开发的独立系统上运行。这使跨部门协同响应突发事件时面临极大的困难。例如，假设水利局监测到一处洪涝事件。尽管这一数据对交通局至关重要（因为洪水有可能严重扰乱交通流量和公共安全），但由于缺乏统一系统，此类信息无法被自动或及时共享。其结果是各部门往往各自为战，从而错失了采取应对措施以减轻对市民和基础设施影响的机会。

为解决这一问题，Linker Vision 开发并部署了一个集成型视觉 AI 赋能平台。该平台借助 NVIDIA 视频搜索与总结 (VSS) AI Blueprint 构建了视频分析 AI 智能体，能够处理全市数千路实时摄像头画面，提供关于交通事件的深度洞察。这些洞察有助于应急部门快速响应并优化城市运营。例如，当 AI 智能体检测到主干道积水时，会自动向相关部门及受影响市民发出警报，并提供包含地点、时间以及建议行动等关键信息。该 AI 平台作为实时数据的统一基础，促进了跨部门协作的实现，进而提升了城市的整体态势感知与决策水平。

NVIDIA 的三大计算平台在 Linker Vision 的实际应用

Linker Vision 基于NVIDIA 三台计算机策略构建其视觉 AI 城市解决方案，为工作流的每个阶段（仿真、训练和实时运行）提供支持。

首先，Linker Vision 借助在 NVIDIA OVX™ 服务器上运行的 NVIDIA Omniverse，将卫星和航拍影像转换为 OpenUSD 场景，构建城市的数字孪生。他们使用 NVIDIA Cosmos™ 生成多样化的合成视频数据，模拟基础设施损毁或洪水等复杂场景，覆盖现实世界中难以捕捉的长尾极端案例。

在 AI 模型训练方面，Linker Vision 采用 NeMo Curator 和 nv-grounding-dino 对现实世界数据进行管护、标注和标记。这些真实数据集和合成数据集被用于调优 VLM，以提高模型精度并深化对复杂城市活动的理解。

在部署阶段，Linker Vision 使用 VSS Blueprint，将 NVIDIA Metropolis 视觉工作流与生成式 AI 模型（包括基于 NVIDIA DGX™ 服务器上 NVIDIA VILA 架构的 VLM）相结合。这样，AI 智能体就能够检测、解析城市运行事件，并为智慧城市运营提供及时的决策洞察。

最后，Linker Vision 将其视觉 AI 工作流接入由 Omniverse 提供支持的实时数字孪生环境，通过整合视觉分析工作流的输出结果，打造交互式指挥中心，供市政管理者直观监控全程范围内发生的事件，并作出响应。

推进 AI 在智慧城市运营中的应用

Linker Vision 正积极推动人工智能生态系统建设，尤其是在智慧城市治理、AI 赋能基础设施和自主决策领域。在高雄市的案例中，该公司正在整合 3 万路多样化的智慧城市摄像头数据流，通过城市级 3D 数字孪生平台进行统一管理。经过训练，该系统已经掌握了十余个主要城市与企业领域的知识（包括交通运输、水务、医疗和物流）以及 300 多个场景，如交通事故、灾害应对、公共安全和基础设施管理。

这些视觉 AI 解决方案提升了城市的宜居性，并将对事件的响应时间缩短了高达 80%。在近期 GTC “基于数字孪生的城市级 AI”的为主题的演讲中，重点展示了 Linker Vision 如何通过集成 NVIDIA AI 技术，在智慧城市、工业自动化和 AI 生态系统中实现实时 AI 处理、大规模模型训练以及跨域 AI 应用。

发挥视觉语言模型 (VLM) 的力量，开始使用 NVIDIA AI Blueprint 进行开发。

探索 VSS Blueprint