Methods and systems for converting unstructured drawings into high-precision digital earth assets

By using image recognition large-scale models and multi-level parsing technology, the efficiency and accuracy issues in converting unstructured drawings into digital earth assets have been solved, achieving high-precision and automated data conversion and display.

CN122309630APending Publication Date: 2026-06-30XIAMEN YUAN EARTH TECHNOLOGY CO LTD

Patent Information

Authority / Receiving Office
CN · China
Patent Type
Applications(China)
Current Assignee / Owner
XIAMEN YUAN EARTH TECHNOLOGY CO LTD
Filing Date
2026-03-27
Publication Date
2026-06-30

Smart Images

  • Figure CN122309630A_ABST
    Figure CN122309630A_ABST
Patent Text Reader

Abstract

This invention provides a method and system for converting unstructured drawings into high-precision digital earth assets. The method includes: reading unstructured drawings and using a large-scale image recognition model to identify geographic features in the unstructured drawings, outputting a preliminary structured data stream; performing multi-level parsing on the preliminary data stream, outputting a set of planar coordinates and feature topological relationships; converting the planar coordinates into latitude and longitude coordinates, and performing spatial correction by combining elevation data and environmental parameters to obtain corrected latitude and longitude coordinates; optimizing the error of the corrected latitude and longitude coordinates using the least squares method or spline interpolation, outputting standardized geographic data; importing the standardized geographic data into a target digital earth platform, where the target digital earth platform performs data conversion on the standardized geographic data and generates a visualization file conforming to the OGC standard for display. This invention achieves intelligent extraction, conversion, and integrated display of digital earth spatial data from drawing images.
Need to check novelty before this filing date? Find Prior Art

Description

Technical Field

[0001] This invention relates to the field of digital earth technology, and more specifically, to a method and system for converting unstructured drawings into high-precision digital earth assets. Background Technology

[0002] With the development of digital earth technology, digitizing geographic information (such as land boundaries, coordinate points, and feature labels) from paper maps and integrating it into the digital earth system has become an important requirement in fields such as geographic information processing, land management, and urban and rural planning.

[0003] There are currently four main implementation schemes:

[0004] OCR recognition combined with manual input: text information on drawings is extracted through optical character recognition, and then manually entered into the system after manual verification; CAD file import: Supports importing DWG / DXF and other format files, but they need to be converted to a specific format beforehand, and cannot directly process scanned images; Image overlay matching: manually aligning the scanned drawing with the base image, relying on manual adjustments to scale, rotation, and displacement; Semi-automatic coordinate extraction tools: such as edge extraction tools based on threshold segmentation to extract information, and then manually select features and calibrate the coordinate system.

[0005] The above-mentioned implementation scheme relies heavily on manual operation and cannot automatically extract geographic features and generate structured data that can be directly displayed in Digital Earth. This results in low processing efficiency, long processing cycle, and processing accuracy affected by the quality of the drawings, which cannot meet the actual use needs. Summary of the Invention

[0006] This invention provides a method for converting unstructured drawings into high-precision digital earth assets, comprising: S101, Read the unstructured drawing and use the image recognition large model to identify the geographical features in the unstructured drawing, and output a preliminary structured data stream; S102, perform multi-level parsing on the preliminary data stream, and output a cleaned set of planar coordinates and element topological relationships; S103 converts the plane coordinates in the plane coordinate set into latitude and longitude coordinates, and performs spatial correction by combining elevation data and environmental parameters to obtain the corrected latitude and longitude coordinates; S104 uses the least squares method or spline interpolation to optimize the error of the corrected latitude and longitude coordinates and outputs standardized geographic data. S105, Import standardized geographic data into the target digital earth platform, and the target digital earth platform performs data transformation on the standardized geographic data to generate a visualization file that conforms to the OGC standard for display.

[0007] Preferably, in step S101, the geographic elements include one or more of the following: land parcel boundary lines, coordinate point markers, text labels, legends, scale bars, and compasses; the preliminary structured data stream contains the element type, location, and associated text information of the geographic elements.

[0008] Preferably, the multi-level parsing in step S102 includes: Invalid information filtering: Remove graphics and text that are irrelevant to geographic information; Semantic association: Based on a pre-built unified description framework for geographic elements, semantic association is performed on the multimodal data output by image recognition; Coordinate association matching: Spatially associate coordinate points with boundary lines and text labels; Planar coordinate analysis: Extracting planar coordinate values ​​from coordinate point markers or text labels; Error detection and elimination: Based on geometric consistency verification, abnormal coordinate points are eliminated.

[0009] Preferably, it further includes: constructing an error dynamic correction link with LLM as the central hub, actively intercepting and repairing errors in the multi-level analysis process, and customizing the correction link in reverse according to the accuracy target to form a collaborative enhancement closed loop.

[0010] Preferably, step S105 specifically includes: The system employs a triple mechanism of "file header identifier recognition + structural feature matching + metadata reading" to identify the category of GIS format and parse it according to the category to obtain parsed information. For parsed information, based on a pre-built industry standard field mapping rule library and custom extension interfaces, the system automatically associates GIS professional attributes with digital earth visualization labels. For the parsed information, a special conversion logic was designed to address the complex geometric types unique to GIS formats, ensuring that the converted geometric shape remains consistent with the original data. The parsed geographic features, mapped attribute labels, and adapted geometric objects are automatically assembled according to the KML / KMZ format specification to generate a visualization file that conforms to the OGC standard; the KML / KMZ is an XML structured format that adopts a "document-folder-landmark" hierarchy.

[0011] Preferably, the GIS format includes Shapefile, GeoJSON, and DXF; wherein: For Shapefile, the .shp file is read to obtain vector graphics data, the .dbf file is used to parse the attribute table structure, and the .prj file is used to extract projection parameters; For GeoJSON, parse the "type-geometry-properties" hierarchical structure of GeoJSON to identify the geometry types FeatureCollection, Polygon, and LineString; For DXF files, the files are parsed segment by segment according to "code-value pairs" to extract primitive types, layer information, and block reference relationships.

[0012] Preferably, the industry standard field mapping rule base has built-in mapping relationships for multiple commonly used industry fields, including uniformly mapping GIS "DKBH / Plot_No / Plot ID" to KML. <name>The tag "surveying accuracy" is mapped to <description>The tag "ownership type" is mapped to a custom value. <attribute name="权属类型">Tags; supports users adding custom mapping rules via configuration files; for unknown fields that do not match any rules, they are automatically categorized as "extended attributes" and encapsulated into KML. <extendeddata>In the tags, ensure that no attribute data is lost.

[0013] Preferably, the special conversion logic includes: For MultiPolygons with holes: Automatically identify the outer and inner boundaries in the GIS, and map the outer boundaries to KML. <outerboundaryis>The labels, with their inner boundaries mapped one by one, are... <innerboundaryis>Tags, through <polygon>The labels combine to form a complete perforated surface element; For Bézier curves / circular arcs: an "adaptive density interpolation algorithm" is adopted, which dynamically adjusts the density of interpolation points according to the curvature of the curve, discretizes the parameterized curve into a polyline supported by the target digital earth platform, while preserving the smoothness of the curve, and controls the interpolation error within ±0.5cm; For polyhedrons / 3D models: The polyhedron in the GIS is split into multiple sets of triangular faces using KML. <polygon>The label defines the vertex coordinates of each face, and through... <style>标签统一配置面的材质、透明度,实现多面体 / 3D模型的完整转换。

[0014] 本发明实施例还提供了一种非结构化图纸到高精度数字地球资产的转换系统,其包括:图纸识别单元,用于读取非结构化图纸,并采用图像识别大模型识别所述非结构化图纸中的地理要素,输出初步结构化数据流;解析单元,用于对所述初步数据流进行多层级解析,输出清洁后的平面坐标集合及要素拓扑关系;校正单元,用于将平面坐标集合内的平面坐标转换为经纬度坐标,结合高程数据与环境参数进行空间校正,得到校正后的经纬度坐标;优化单元,用于采用最小二乘法或样条插值对校正后的经纬度坐标误差优化,输出标准化地理数据;转换单元,用于将标准化地理数据导入到目标数字地球平台,由所述目标数字地球平台对标准化地理数据进行数据转换后,生成符合OGC标准的可视化文件进行展示。

[0015] 与现有技术相比,本实施例具有如下有益效果:通过图像识别大模型实现了地理要素的自动化、高精度识别以及录入,将传统需要数小时的人工描点录入工作,缩短至分钟级的全自动处理;通过自适应密度插值算法,将曲线转换误差控制在±0.5cm以内,解决了以往图纸变形导致的数据偏差问题;以 LLM 为中枢构建误差动态修正链路,对解析过程主动拦截修复误差,并以精度目标反向定制修正链路,形成协同增强闭环;通过自定义字段映射规则,解决了GIS专业属性(如‘权属类型’)在数字地球展示中丢失的问题,实现了‘图-属’一体化集成;通过直接生成符合OGC标准的KML / KMZ可视化文件,实现与数字地球平台的无缝对接,进而实现地球资源的效果数字化和场景化。附图说明

[0016] 为了更清楚地说明本发明实施方式的技术方案,下面将对实施方式中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

[0017] 图1是本发明第一实施例提供的非结构化图纸到高精度数字地球资产的转换方法的流程示意图。

[0018] 图2是本发明第二实施例提供的非结构化图纸到高精度数字地球资产的转换方法系统的模块示意图。具体实施方式

[0019] 为使本发明实施方式的目的、技术方案和优点更加清楚,下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。因此,以下对在附图中提供的本发明的实施方式的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。

[0020] 本发明实施例提供了一种非结构化图纸到高精度数字地球资产的转换方法,其通过自动化处理流程,有效提升了转换效率和数据精度。该方法包括以下步骤:S101,读取非结构化图纸,并采用图像识别大模型识别该非结构化图纸中的地理要素,输出初步结构化数据流。

[0021] 在本实施例中,所述非结构化图纸可以被读取为图像文件,例如JPEG、PNG或TIFF格式等,在读取图像文件后,可对图像进行去噪、增强、二值化预处理后输入到图像识别大模型。

[0022] 在本实施例中,图像识别大模型可以是一个预训练的基于CNN或Transformer的视觉模型,其被配置为识别图像中的图形、线条和文本区域。在识别过程中,该模型被用于检测图纸上的各种视觉特征,例如连续的线条、离散的点以及文本块。识别结果被组织成一个初步的结构化数据流,其中包含被识别特征的原始像素位置和其对应的文本内容(如果存在)。例如,一条被识别的线段可以被表示为其起点和终点的像素坐标,以及其可能关联的任何文本标签。

[0023] 在本实施例中,所述地理要素指在地理空间中具有特定位置、形态和属性的实体,例如地块边界、道路、河流、建筑物、坐标点、文字标注、图例、比例尺、指北针等。

[0024] S102,对该初步数据流进行多层级解析,输出清洁后的平面坐标集合及要素拓扑关系。

[0025] 在本实施例中,在将非结构化图纸通过图像识别大模型初步识别为结构化数据流后,该初步数据流可能包含大量冗余、错误或未充分关联的信息。若直接进行后续的空间转换和优化,将难以保证最终数字地球资产的精度和可靠性,甚至可能导致数据失真或无法正确展示。因此,需要对初步数据流进行多层级解析,包括:无效信息过滤、坐标关联匹配、平面坐标解析以及误差检测与排除。

[0026] 具体而言,无效信息过滤旨在从初步结构化数据流中剔除与地理信息无关的图形和文字。该过程可以通过预设规则库、机器学习分类器或语义分析技术实现,识别并移除例如图框、标题栏、公司标志、非地理性说明文字等非核心要素,确保后续处理的数据纯净性。

[0027] 语义关联:基于预构建的地理要素统一描述框架,对图像识别输出的多模态数据进行语义关联。

[0028] 其中,考虑到多模态包括图像、文本、地理三种模态,模态之间存在数据壁垒,导致语义断层与格式差异,无统一中间层桥接,各模块无法有效协同。

[0029] 为此,本实施例定义了地理要素统一描述框架来实现跨模态打通。具体为:统一语义,建立地理实体 - 几何 - 属性 - 关系 - 精度标准化表达(点 / 线 / 面、道路 / 建筑 / 水系、层级、权属、精度等级等);跨模态适配:打通图纸文本、图形、栅格、点云、影像、GIS、BIM数据格式与坐标体系,实现多模态数据进行语义关联。

[0030] 坐标关联匹配用于将初步识别出的坐标点与边界线、文字标注进行空间关联。这通常通过空间邻近性分析、拓扑关系判断或图结构构建来完成。例如,将一个坐标点与其最近的边界线段或多边形顶点进行绑定,或将描述地理属性的文字标注(如地块编号、高程值)与空间上邻近的坐标点或封闭边界线进行关联,从而建立要素间的逻辑联系。

[0031] 平面坐标解析负责从坐标点标记或文字标注中精确提取平面坐标值。此步骤通常结合光学字符识别(OCR)技术将图像中的坐标文本转换为数字,并利用正则表达式或模式匹配算法从提取的文本中解析出符合特定格式的X、Y坐标数值。对于坐标点标记,其几何中心或特定锚点可能直接代表坐标位置,而其伴随的文本则提供具体的数值。

[0032] 误差检测与排除则基于几何一致性校验,排除异常坐标点。这包括但不限于检查多边形自相交、线段断裂、点位异常偏离预期几何形态等。可以采用统计学方法(如离群点检测)、拓扑规则检查或几何约束验证等手段,识别并剔除因原始图纸质量、扫描误差或识别错误导致的异常数据点,以保证坐标数据的准确性和可靠性。

[0033] 在本实施例中,在上述的多层级解析过程,可能存在解析误差或识别误差,这些误差在传统线性流程中会被后序步骤指数级放大,从而影响最终数字地球资产的精度和可靠性。

[0034] 为此,在本实施例中,在完成多层级解析后,本实施例还进一步的以 LLM 为中枢构建误差动态修正链路,对所述多层级解析过程主动拦截修复误差,并以精度目标反向定制修正链路,形成协同增强闭环。

[0035] 具体而言,本实施例以LLM 中枢来构建误差动态修正链路进行主动纠错,LLM 承担全局决策、语义理解、误差诊断、修复指令下发,替代传统固定规则校验。

[0036] 动态修正链路可包括:1)前置拦截:对输入的解析后的数据先经 LLM 做语义合规、拓扑冲突、属性缺失预判;2)实时检测:提取、矢量化、坐标转换、建模全环节误差回传 LLM,如错位、漏要素、属性错误、精度不达标等;3)主动修复:LLM 生成修复策略,如补全、纠拓扑、对齐、重匹配,调度下游模块执行;4)闭环验证:修正结果回检,不达标则二次修正 / 人工兜底,保证精度收敛。

[0037] 进一步的,还可以根据精度目标反向定制修正链路,具体为:目标倒推:以数字地球资产精度指标(平面精度、高程精度、拓扑一致性、要素完整率)反向定义,如定义为:提取精度 → 矢量化规则 → 坐标转换 → 建模参数 → 质检阈值;协同增强:LLM 调度各模块互相补偿(识别不准→几何约束补强;拓扑错误→语义规则修复);持续迭代:误差数据回流训练,不断提高链路的修正准确率。通过上述技术方案,能够显著提升从初步结构化数据流中提取地理信息的质量,为后续的经纬度转换、空间校正和误差优化奠定了坚实的基础,极大地提高了最终数字地球资产的精度和可靠性,避免了因原始数据质量问题导致的误差累积,使得数字地球平台能够展示出更真实、更精确的地理信息。

[0038] S103,将平面坐标集合内的平面坐标转换为经纬度坐标,结合高程数据与环境参数进行空间校正,得到校正后的经纬度坐标。

[0039] 在本实施例中,平面坐标到经纬度坐标的转换可以通过标准的地图投影逆变换算法实现,例如,如果图纸采用高斯-克吕格投影,则使用相应的逆投影公式进行计算。在转换过程中,需要输入预设的高程数据,例如一个统一的平均高程值,以及一系列环境参数,例如图纸所对应的区域的中央子午线、投影带号等。这些参数可以由用户手动输入或从图纸的元数据中获取。空间校正可以包括对转换后的经纬度坐标进行整体平移、旋转和缩放,以使其与已知的参考地理点位对齐。例如,通过选择图纸上的几个已知地理坐标点作为控制点,计算一个仿射变换矩阵,并将其应用于所有转换后的经纬度坐标。

[0040] S104,采用最小二乘法或样条插值对校正后的经纬度坐标误差优化,输出标准化地理数据。

[0041] 在本实施例中,对校正后的经纬度坐标误差进行优化,可以采用数学模型进行拟合。例如,当存在多个控制点时,可以利用最小二乘法构建一个误差模型,通过最小化所有控制点残差平方和来调整坐标。或者,当需要更平滑的插值效果时,可以采用样条插值方法,通过构建分段多项式函数来拟合控制点之间的曲线,从而对非控制点区域的坐标进行更精细的调整。优化过程旨在进一步减小坐标的系统性误差和随机误差。优化完成后,生成的数据被组织成一种统一的、易于后续处理的格式,即标准化地理数据,其包含地理要素的几何信息和基本的属性信息。

[0042] S105,将标准化地理数据导入到目标数字地球平台,由该目标数字地球平台对标准化地理数据进行数据转换后,生成符合 OGC 标准的可视化文件进行展示。

[0043] 在本实施例中,标准化地理数据通常为GIS格式,其能够被导入到目标数字地球平台。该平台接收数据后,会根据其内部预设的规则对数据进行初步的解析和转换。例如,平台可能支持将简单的点、线、面几何对象直接转换为其内部的数据结构。对于属性信息,平台可以将其作为通用文本标签进行存储。随后,平台将这些内部数据结构转换为符合OGC标准的可视化文件格式,例如一个基本的XML文件,其中包含地理要素的坐标和简单的描述信息。该可视化文件随后被加载并呈现在数字地球平台上,供用户进行浏览和交互。

[0044] 综上所述,本申请通过采用图像识别大模型对非结构化图纸中的地理要素进行自动化识别,并结合多层级解析、空间校正及误差优化技术,有效解决了传统方案中人工操作依赖性高、处理效率低、精度受限的问题。由此,实现了非结构化图纸到高精度数字地球资产的自动化、高效转换,显著提升了地理信息处理的准确性和可靠性,满足了土地管理、城乡规划等领域对高质量数字地理数据的需求。

[0045] 下面对本发明的一些优选实施例做更进一步的描述。

[0046] 在上述实施例中,需要将 GIS格式换为目标数字地球平台支持的格式。然而现有GIS 格式(Shapefile、GeoJSON 等)以矢量拓扑和专业属性字段为核心,与数字地球平台(KML / KMZ)的 3D 可视化格式在结构、标签体系、几何对象定义上存在本质差异,体现在:1、结构差异:GIS 格式采用 "图层 - 要素 - 属性表” 三级结构(如 Shapefile包含.shp 图形文件、.dbf 属性表、.shx 索引文件),属性字段侧重专业测绘信息(如权属编号、测绘日期、精度等级、投影参数);而 KML / KMZ 为 XML 结构化格式,采用 "文档 - 文件夹 - 地标(Placemark)” 层级,核心字段聚焦 3D 渲染配置(如颜色、透明度、高度模式、图标样式),两者字段体系无天然映射关系2、标签体系差异:GIS 格式的属性字段无统一命名规范(如 "地块编号” 可能标注为 "DKBH”"Plot_No”"地块 ID”),且字段类型多样(字符型、数值型、日期型);而数字地球格式的标签为固定标准化标签(如<Kml>、<Placemark>、<Style>、<Point>),需将 GIS 的非标准化专业字段转换为可视化标签,现有技术无自动化映射规则。

[0047] 3、几何对象定义差异:GIS 支持复杂拓扑几何对象(如带孔洞的 MultiPolygon、贝塞尔曲线、多面体),且曲线以参数化方式存储(如圆弧仅记录圆心、半径、起始角度);而数字地球平台对几何对象的支持更侧重渲染效率,通常要求将曲线离散为折线、孔洞需通过<innerBoundaryIs>标签单独定义、多面体需拆分为多个 3D 面集,现有技术无法自动完成复杂几何对象的结构化转换,需人工通过 QGIS、ArcGIS 等专业工具手动拆分、格式映射,操作繁琐且易导致数据丢失(如孔洞遗漏、曲线变形)。为此,需要有一套完整的转换逻辑。

[0048] 具体地,针对GIS格式到KML / KMZ的转换,本实施例采用了如下步骤:通过"文件头标识识别 + 结构特征匹配 + 元数据读取” 三重机制,识别GIS格式的类别,并根据GIS格式的类别进行解析,得到解析信息。

[0049] 在本实施例中,"文件头标识识别 + 结构特征匹配 + 元数据读取”的三重机制旨在实现对多种GIS格式的鲁棒性识别与解析。具体而言,文件头标识识别通过检查文件起始处的特定字节序列或魔术数字,快速判断文件类型,例如,Shapefile的.shp文件通常以特定整数值开头。结构特征匹配则进一步分析文件内部的特定结构元素、关键字或数据块布局,以确认文件格式的有效性和完整性,例如,GeoJSON文件必须符合特定的JSON结构。元数据读取则从文件中提取格式特有的元数据信息,如投影参数、编码方式等,为后续的精确解析提供必要上下文。通过这三种机制的协同作用,能够有效应对GIS数据格式的多样性,确保解析过程的准确性。

[0050] 在本实施例中,可通过 "文件头标识识别 + 结构特征匹配 + 元数据读取” 三重机制自动兼容 12 种主流 GIS 格式(Shapefile、GeoJSON、DXF、GDB、GeoPackage 等),在识别到GIS 格式,即可对其进行解析。例如,对于Shapefile,读取Shapefile的.shp文件获取矢量图形数据,.dbf文件解析属性表结构、.prj文件提取投影参数。其中,Shapefile是一种广泛使用的矢量数据格式,通常由多个文件组成,每个文件承载不同类型的信息。其中,`.shp`文件是核心,用于存储地理要素的几何形状,例如点、线或多边形。`.dbf`文件则用于存储与这些几何要素相关联的属性数据,通常以表格形式组织,包含要素的各种描述性信息。而`.prj`文件则记录了数据的投影和坐标系统参数,这对于确保地理数据的空间准确性和与其他数据的兼容性至关重要。在实际操作中,系统会通过专门的解析模块,分别读取并整合这些文件中的信息,以获取完整的矢量图形数据、属性表结构和投影参数。

[0051] 对于GeoJSON,解析GeoJSON的"type-geometry-properties”层级结构,识别FeatureCollection、Polygon、LineString几何类型。其中,GeoJSON是一种基于JavaScript对象表示法(JSON)的地理空间数据交换格式,因其轻量级和易于解析的特点而受到青睐。其核心在于"type-geometry-properties”的层级结构。其中,"type”字段定义了GeoJSON对象的类型,例如FeatureCollection、Feature或Geometry对象;"geometry”字段则包含了地理要素的几何信息,如点(Point)、线串(LineString)或多边形(Polygon)等;"properties”字段则用于存储与该地理要素相关的非空间属性数据。系统通过标准的JSON解析器,能够高效地识别并提取这些层级结构中的几何类型和属性信息。

[0052] 对于DXF,对DXF文件按"代码-值对”逐段解析,提取图元类型、图层信息、块引用关系。其中,DXF(Drawing Exchange Format)是AutoCAD软件用于数据交换的一种文件格式,广泛应用于工程设计和测绘领域。DXF文件以文本或二进制形式存储,其内容由一系列"代码-值对”组成,每个代码代表一个特定的数据项或属性。系统在解析DXF文件时,会按照这种"代码-值对”的结构逐段进行解析。通过识别不同的代码,可以提取出文件中的各种图元类型(如直线、圆弧、文本等)、图层信息(每个图元所属的图层)以及复杂的块引用关系(即重复使用的图形组件及其在图纸中的位置和变换信息)。这种解析方式确保了CAD图纸中所有地理相关信息的准确提取和重构。

[0053] 通过上述技术方案,本申请能够有效应对GIS数据格式多样性带来的挑战。

[0054] 对解析信息,基于预先构建的行业标准字段映射规则库以及自定义扩展接口,实现 GIS 专业属性与数字地球可视化标签的自动化关联。

[0055] 在本实施例中,所述行业标准字段映射规则库内置多个行业常用字段映射关系,旨在预先存储和管理不同行业领域中GIS属性字段与目标数字地球平台(如KML)可视化标签之间的对应关系。例如,在土地管理领域,GIS数据中表示地块编号的字段可能命名为"DKBH”、"Plot_No”或"地块 ID”,这些字段在KML中通常需要映射到用于显示名称的`<name>`标签。同样,"测绘精度”这样的描述性属性可以映射到KML的`<description>`标签,而"权属类型”等特定业务属性则可映射为自定义的`<Attribute name="权属类型">`标签。这种内置的映射关系通过提供一套开箱即用的、针对常见业务场景的转换规则,极大地简化了数据转换的配置工作,提高了转换的自动化程度和准确性。其实现方式可以是一个预定义的数据库表、XML文件或JSON配置文件,其中包含源字段名、目标标签名以及可能的转换函数或类型。

[0056] 为了应对GIS数据属性字段的复杂性和多样性,本实施例还支持用户通过配置文件添加自定义映射规则。这意味着当遇到内置规则库未能覆盖的特定行业字段或用户自定义字段时,用户无需修改核心程序代码,只需编辑外部配置文件(例如XML、JSON或CSV格式)即可扩展映射能力。例如,用户可以定义将GIS中的"建设单位”字段映射到KML的`<ExtendedData>`标签下的一个特定子标签。这种机制提供了高度的灵活性和可扩展性,确保系统能够适应不断变化的业务需求和数据标准,降低了维护成本。

[0057] 进一步的,考虑到在GIS数据转换过程中,总会存在一些属性字段,它们既不在内置的行业标准映射规则中,也未被用户通过自定义配置文件明确指定映射关系。为了避免这些未知但可能重要的属性信息在转换过程中丢失,本实施例引入了一种智能处理机制,即针对未匹配到规则的未知字段,自动归类为"扩展属性”并封装至KML的<ExtendedData>标签中。系统会自动识别这些未匹配字段,并将其统一归类为"扩展属性”。随后,这些扩展属性及其对应的值会被封装到KML格式的`<ExtendedData>`标签中。`<ExtendedData>`标签是KML标准中用于存储非标准或自定义数据的容器,它允许在不破坏KML结构的前提下,保留原始GIS数据中的所有属性信息。例如,如果GIS数据中有一个名为"备注”的字段未被映射,它将被转换为`<ExtendedData><Data name="备注"><value>...< / value>< / Data>< / ExtendedData>`的形式。这种处理方式确保了数据转换的完整性,防止了任何潜在的数据丢失,同时保持了输出KML文件的规范性。

[0058] 通过上述技术方案,本实施例有效解决了在将GIS专业属性与数字地球可视化标签进行自动化关联时,因GIS数据属性字段多样性、行业差异性以及自定义需求导致的属性信息丢失和转换效率低下的问题。

[0059] 对解析信息,针对 GIS 格式特有的复杂几何类型,设计专项转换逻辑,确保转换后几何形态与原始数据一致。

[0060] 在本实施例中,所述专项转换逻辑包括:对于带孔洞 MultiPolygon:自动识别GIS中的外边界与内边界,将外边界映射为KML的<outerBoundaryIs>标签,内边界逐一映射为<innerBoundaryIs>标签,通过<Polygon>标签组合形成完整带孔洞面要素。在GIS数据中,带孔洞的MultiPolygon是一种常见的复杂面要素,用于表示具有内部空洞的地理区域,例如带有湖心岛的湖泊或带有庭院的建筑物。为了在数字地球平台上准确呈现这类要素,本实施例的转换逻辑能够智能地识别出GIS数据中MultiPolygon的外边界和所有内边界。随后,这些识别出的边界会被精确地映射到KML格式中对应的标签:外边界被映射为<outerBoundaryIs>标签,而每一个内边界则被逐一映射为<innerBoundaryIs>标签。最终,通过KML的<Polygon>标签将这些内外边界组合起来,从而形成一个在数字地球平台上完整且拓扑正确的带孔洞面要素。这种处理方式确保了原始GIS数据中复杂的空间关系和几何形态得以忠实地保留。

[0061] 对于贝塞尔曲线 / 圆弧:采用"自适应密度插值算法”,根据曲线曲率动态调整插值点密度,将参数化曲线离散为目标数字地球平台支持的折线,同时保留曲线平滑性,插值误差控制在±0.5cm内。GIS数据中常包含贝塞尔曲线或圆弧等参数化曲线,它们以数学方程定义,具有高度的平滑性。然而,大多数数字地球平台通常通过一系列离散的直线段(即折线)来表示曲线。为了在转换过程中既能保持曲线的视觉平滑度,又能避免生成过多的数据点,本实施例采用了一种"自适应密度插值算法”。该算法的核心在于能够根据曲线的局部曲率动态地调整插值点的密度。在曲线弯曲度较大的区域,会增加插值点的数量以捕捉细节;而在曲线较为平直的区域,则会减少插值点,从而优化数据量。通过这种方式,参数化曲线被高效且精确地离散化为目标数字地球平台能够支持的折线形式,同时严格控制插值误差在±0.5cm以内,确保了转换后曲线的几何精度和视觉效果与原始数据高度一致。

[0062] 对于多面体 / 3D模型:将GIS中的多面体拆分为多个三角形面集,通过 KML 的<Polygon>标签定义每个面的顶点坐标,并通过<Style>标签统一配置面的材质、透明度,实现多面体 / 3D模型的完整转换。在GIS数据中,多面体或3D模型用于表示具有三维空间属性的地理实体,例如建筑物、桥梁或地形模型。为了将这些复杂的3D结构准确地导入到数字地球平台并进行可视化,本实施例的转换逻辑首先将GIS中的多面体分解为一系列基本的三角形面集。每个三角形面集都由其顶点坐标定义,并被映射为KML的<Polygon>标签。此外,为了确保转换后的3D模型在视觉上与原始数据保持一致,本申请还通过KML的<Style>标签统一配置了每个面的材质和透明度等视觉属性。这种方法使得复杂的3D模型能够在数字地球平台上得到完整且视觉真实的呈现,极大地丰富了数字地球资产的三维表现力。

[0063] 通过上述专项转换逻辑,本实施例能够有效解决GIS数据中复杂几何类型在转换为数字地球可视化格式时可能出现的几何失真、拓扑关系丢失以及可视化效果不佳的问题。这些措施共同确保了非结构化图纸经过多阶段处理后,最终在数字地球平台上呈现的地理资产具有极高的几何精度、拓扑正确性和视觉真实感,从而显著提升了数字地球资产的可用性和可靠性。

[0064] 自动将解析后的地理要素、映射后的属性标签、适配后的几何对象,按 KML / KMZ格式规范组装,生成符合 OGC 标准的可视化文件。

[0065] 本实施例将解析后的地理要素、映射后的属性标签以及经过适配的几何对象,严格按照KML / KMZ的规范进行组装。KML / KMZ采用XML结构化格式,其层级结构通常包括"文档(Document)”、"文件夹(Folder)”和"地标(Placemark)”,这种分层组织方式便于用户对地理信息进行分类管理和浏览。通过生成符合OGC标准的KML / KMZ文件,确保了转换后的数字地球资产具有良好的互操作性、通用性和可视化效果,能够在各种支持OGC标准的数字地球平台或地理信息浏览器中无缝展示。同时支持在数字地球平台中高亮展示地块边界、坐标点、属性信息以及交互式查询、测量、导出等。

[0066] 请参阅图2,本发明第二实施例还提供了一种非结构化图纸到高精度数字地球资产的转换系统,其包括:图纸识别单元210,用于读取非结构化图纸,并采用图像识别大模型识别所述非结构化图纸中的地理要素,输出初步结构化数据流;解析单元220,用于对所述初步数据流进行多层级解析,输出清洁后的平面坐标集合及要素拓扑关系;校正单元230,用于将平面坐标集合内的平面坐标转换为经纬度坐标,结合高程数据与环境参数进行空间校正,得到校正后的经纬度坐标;优化单元240,用于采用最小二乘法或样条插值对校正后的经纬度坐标误差优化,输出标准化地理数据;转换单元250,用于将标准化地理数据导入到目标数字地球平台,由所述目标数字地球平台对标准化地理数据进行数据转换后,生成符合OGC标准的可视化文件进行展示。

[0067] 与现有技术相比,本系统通过图像识别大模型实现了地理要素的自动化、高精度识别,避免了传统OCR识别结合人工录入的低效率和高错误率。多层级解析、空间校正和误差优化步骤,显著提升了数据处理的自动化程度和精度,解决了半自动坐标提取工具依赖人工干预和精度受限的问题。此外,直接生成符合OGC标准的KML / KMZ可视化文件,实现了与数字地球平台的无缝对接,无需像CAD文件导入那样进行预先格式转换,也避免了图像叠加匹配中人工对齐的繁琐和不精确性。整个流程高度自动化,大幅缩短了处理周期,提高了工作效率,并确保了最终数字地球资产的高精度和标准化。

[0068] 以上所述仅为本发明的优选实施方式而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。< / style> < / polygon> < / polygon> < / innerboundaryis> < / outerboundaryis> < / extendeddata> < / attribute> < / description> < / name>

Claims

1. A method for converting unstructured drawings into high-precision digital earth assets, characterized in that, include: S101, Read the unstructured drawing and use the image recognition large model to identify the geographic features in the unstructured drawing, and output a multimodal preliminary structured data stream; S102, perform multi-level parsing on the preliminary data stream, and output a cleaned set of planar coordinates and element topological relationships; S103 converts the plane coordinates in the plane coordinate set into latitude and longitude coordinates, and performs spatial correction by combining elevation data and environmental parameters to obtain the corrected latitude and longitude coordinates; S104 uses the least squares method or spline interpolation to optimize the error of the corrected latitude and longitude coordinates and outputs standardized geographic data. S105, Import standardized geographic data into the target digital earth platform, and the target digital earth platform performs data transformation on the standardized geographic data to generate a visualization file that conforms to the OGC standard for display.

2. The method for converting unstructured drawings into high-precision digital earth assets according to claim 1, characterized in that, In step S101, the geographic elements include one or more of the following: land parcel boundary lines, coordinate point markers, text labels, legends, scale bars, and compasses; the preliminary structured data stream contains the element type, location, and associated text information of the geographic elements.

3. The method for converting unstructured drawings to high-precision digital earth assets according to claim 2, characterized in that, The multi-level parsing in step S102 includes: Invalid information filtering: Remove graphics and text that are irrelevant to geographic information; Semantic association: Based on a pre-built unified description framework for geographic elements, semantic association is performed on the multimodal data output by image recognition; Coordinate association matching: Spatially associate coordinate points with boundary lines and text labels; Planar coordinate analysis: Extracting planar coordinate values ​​from coordinate point markers or text labels; Error detection and elimination: Based on geometric consistency verification, abnormal coordinate points are eliminated.

4. The method for converting unstructured drawings to high-precision digital earth assets according to claim 3, characterized in that, Also includes: An error dynamic correction link is constructed with LLM as the central hub to actively intercept and repair errors in the multi-level analysis process, and the correction link is customized in reverse according to the accuracy target to form a collaborative enhancement closed loop.

5. The method for converting unstructured drawings into high-precision digital earth assets according to claim 1, characterized in that, The standardized geographic data is in GIS format; the GIS format adopts a three-level structure of "layer-feature-attribute table".

6. The method for converting unstructured drawings to high-precision digital earth assets according to claim 5, characterized in that, Step S105 specifically includes: The system employs a triple mechanism of "file header identifier recognition + structural feature matching + metadata reading" to identify the category of GIS format and parse it according to the category to obtain parsed information. For parsed information, based on a pre-built industry standard field mapping rule library and custom extension interfaces, the system automatically associates GIS professional attributes with digital earth visualization labels. For the parsed information, a special conversion logic was designed to address the complex geometric types unique to GIS formats, ensuring that the converted geometric shape remains consistent with the original data. The parsed geographic features, mapped attribute labels, and adapted geometric objects are automatically assembled according to the KML / KMZ format specification to generate a visualization file that conforms to the OGC standard; the KML / KMZ is an XML structured format that adopts a "document-folder-landmark" hierarchy.

7. The method for converting unstructured drawings to high-precision digital earth assets according to claim 6, characterized in that, The GIS formats include Shapefile, GeoJSON, and DXF; wherein: For Shapefile, the .shp file is read to obtain vector graphics data, the .dbf file is used to parse the attribute table structure, and the .prj file is used to extract projection parameters; For GeoJSON, parse the "type-geometry-properties" hierarchical structure of GeoJSON to identify the geometry types FeatureCollection, Polygon, and LineString; For DXF files, the file is parsed segment by segment according to "code-value pairs" to extract primitive types, layer information, and block reference relationships.

8. The method for converting unstructured drawings to high-precision digital earth assets according to claim 6, characterized in that, The industry-standard field mapping rule library contains multiple commonly used industry field mapping relationships, including a unified mapping of GIS "DKBH / Plot_No / Plot ID" to KML. <name>The tag "surveying accuracy" is mapped to <description>The tag "ownership type" is mapped to a custom value. <attribute name="权属类型">Tags; supports users adding custom mapping rules via configuration files; for unknown fields that do not match any rules, they are automatically categorized as "extended attributes" and encapsulated into KML. <extendeddata> In the tags, ensure that no attribute data is lost.< / extendeddata> < / attribute> < / description> < / name> 9. The method for converting unstructured drawings to high-precision digital earth assets according to claim 6, characterized in that, The specific conversion logic includes: For MultiPolygons with holes: Automatically identify the outer and inner boundaries in the GIS, and map the outer boundaries to KML. <outerboundaryis>The labels, with their inner boundaries mapped one by one, are... <innerboundaryis>Tags, through <polygon> The labels combine to form a complete perforated surface element;< / polygon> < / innerboundaryis> < / outerboundaryis> For Bézier curves / circular arcs: an "adaptive density interpolation algorithm" is adopted, which dynamically adjusts the density of interpolation points according to the curvature of the curve, discretizes the parameterized curve into a polyline supported by the target digital earth platform, while preserving the smoothness of the curve, and controls the interpolation error within ±0.5cm; For polyhedrons / 3D models: The polyhedron in the GIS is split into multiple sets of triangular faces using KML. <polygon>The label defines the vertex coordinates of each face and passes them to the <style>标签统一配置面的材质、透明度,实现多面体 / 3D模型的完整转换。10.一种非结构化图纸到高精度数字地球资产的转换系统,其特征在于,包括:图纸识别单元,用于读取非结构化图纸,并采用图像识别大模型识别所述非结构化图纸中的地理要素,输出初步结构化数据流;解析单元,用于对所述初步数据流进行多层级解析,输出清洁后的平面坐标集合及要素拓扑关系;校正单元,用于将平面坐标集合内的平面坐标转换为经纬度坐标,结合高程数据与环境参数进行空间校正,得到校正后的经纬度坐标;优化单元,用于采用最小二乘法或样条插值对校正后的经纬度坐标误差优化,输出标准化地理数据;转换单元,用于将标准化地理数据导入到目标数字地球平台,由所述目标数字地球平台对标准化地理数据进行数据转换后,生成符合OGC标准的可视化文件进行展示。< / style> < / polygon>