城市旅行个性化定制：大型语言模型与空间优化的协同创新

引言：

“ 随着城市化进程的加快和人们生活水平的提高，城市旅行成为越来越受欢迎的休闲方式。然而，传统的旅行路线规划方法在处理用户个性化需求时存在一定的局限性。本文介绍一篇利用大型语言模型和空间优化技术在城市旅行路线规划领域创新应用的论文，为企业界和学术界提供了新的研究思路”

01

—

论文概述

这篇论文的标题为“Synergizing Spatial Optimization with Large Language Models for Open-Domain Urban Itinerary Planning”，发表在2024年。作者来自TuTu AI、麻省理工大学和上海交通大学等机构，主要研究内容是利用空间优化和大型语言模型相结合的方法，为用户提供个性化城市旅行路线规划服务。论文提出了开放域城市旅行路线规划(OUIP)问题，旨在根据用户自然语言输入生成个性化城市旅行路线。论文作者们（其中包含TuTu AI的创始人）开发了ItiNera系统，该系统结合了空间优化和大型语言模型，可以提供更加个性化和空间一致性的路线规划服务。实验证明，ItiNera系统在各项指标上均优于当前基于语言模型的解决方案。生成的路线更具个性化和空间一致性。

02

—

论文详细介绍

关键术语介绍：

开放域城市旅行路线规划(OUIP)：是”Open-domain Urban Itinerary Planning”的缩写，这通常指的是一个能够处理广泛、未特定化领域内的城市旅行规划请求的系统或方法。不同于限定在某个特定领域（如某个具体城市或特定类型的旅行活动）的行程规划，开放领域城市行程规划能够更广泛地理解和处理各种城市、旅行类型和用户需求，提供更加个性化和灵活的旅行规划服务。

城市行程规划空间优化：通常指通过算法和数学模型来规划城市旅行路径，以达到如下目的之一或多个：

最小化旅行时间：通过优化路径选择，减少从起点到终点或多个兴趣点之间的总旅行时间。

最大化景点覆盖：在有限的时间内，规划出能访问最多景点的行程路径。

考虑用户偏好：根据用户对景点类型（如博物馆、公园等）的偏好，优化行程路径以包含更多用户感兴趣的地点。

避免拥堵区域：考虑城市交通情况，规避高峰时段的拥堵区域，优化行程的顺畅度。

【延伸：空间优化算法可能包括图论中的最短路径算法（如Dijkstra算法或A*算法）、旅行商问题（TSP）求解算法、模拟退火算法、遗传算法等，具体使用哪种算法取决于行程规划的具体要求和约束条件。通过空间优化，可以显著提高旅行规划的效率和用户满意度，是智能旅行规划系统中的一个关键技术。】

论文背景：

城市旅行路线规划是一个复杂的问题，需要综合考虑用户的个性化需求、POI的时空关系等因素。传统方法往往局限于预设的POI组合和简单的用户约束，生成的路线缺乏个性化。

研究方法：

该文章的研究方法集中在开放领域城市行程规划（OUIP）问题的解决方案上，该解决方案通过整合大型语言模型（LLMs）与空间优化技术来生成个性化且空间上连贯的行程，直接从自然语言请求中出发。具体的研究方法包括：

用户和市场研究：通过用户和市场研究，发现旅行者越来越依赖社交媒体获取旅行前信息，特别是用户生成的内容，因其真实性和个性化高于官方信息源。
自动化POI信息提取流水线：开发了一个自动化流水线，从各种社交媒体平台提取兴趣点（POIs）和相关信息，允许用户输入旅行帖子的链接来自动提取POIs。
LLMs在城市应用中的研究：探索了LLMs在城市数据处理、城市规划、人类移动性模式预测等方面的应用潜力，展示了LLMs在理解复杂城市环境中的强大能力。
OUIP问题的定义和系统设计：提出了OUIP问题，并设计实现了ItiNera系统，这是首次将空间优化与LLMs结合，创建个性化、空间连贯的细粒度城市行程。其中，所设计ItiNera系统包含五个模块：用户拥有的POI收集、请求分解、POI检索、空间优化和路线生成。

（ItiNera系统概述）

- UPC模块（User-owned POI Collection模块）的作用是从网络内容中自动提取兴趣点（POIs）的特征，并动态更新用户个人拥有的POI数据库。这一模块通过自动化地抓取和提取来自不同社交媒体平台的POI信息，确保了POI信息的定制化和时效性，为后续的开放领域城市行程规划（OUIP）任务提供了基础。
- RD模块（Request Decomposition模块）利用大型语言模型（LLMs）的高级自然语言处理能力，将单一的用户请求分解为多个独立的子请求，每个子请求都能根据其具体性、细节程度和用户态度被进一步分类和处理。
- PR模块（POI检索模块）的主要作用是从用户拥有的POI数据库中筛选出与用户请求最相关的兴趣点（POIs）。这个模块通过使用嵌入模型来处理用户请求，生成请求的“正”和“负”信息字段的嵌入表示，然后利用这些嵌入来查询和检索出与用户需求最匹配的POIs。
- SO模块（Spatial Optimization模块）的主要作用是确保行程在空间上的连贯性。这一模块通过解决层次化的旅行商问题（TSP），用来空间过滤和排列检索到的兴趣点（POIs），从而获得候选POIs。这一过程确保了生成的行程不仅满足用户的特定需求，还在空间上合理和高效，最大限度地提升旅行体验。
- IG模块（Itinerary Generation模块）的主要作用是利用大型语言模型（LLMs）生成符合用户需求的最终行程。这一模块利用LLMs的高级推理和规划能力，结合从POI检索（PR）模块和空间优化（SO）模块得到的信息，生成满足各种复杂约束的最终行程。

评估指标设计：设计了一系列基于规则和基于GPT的评估指标，以衡量生成行程的质量和个性化程度，为未来OUIP研究提供了一个全面的评价框架。
实验与评估：通过广泛的实验，包括离线数据集上的实验和在线主观评价，验证了ItiNera系统在提供更具响应性和空间连贯性的行程方面的能力，相较于当前的LLM-based解决方案。
在线主观评估：在TuTu在线OUIP服务中进行在线主观评估，通过用户研究来评估输出质量的特定维度，收集了来自107个用户的231个结果，这些评分随后用于提升系统，以增强用户体验。

关键方法逻辑拆解：

UPC模块（User-owned POI Collection模块）主要功能包括：

- 自动化信息抓取：从用户提供的旅行相关帖子链接中抓取文本、图片和视频信息。
- 特征提取：利用自动语音识别（ASR）技术和光学字符识别（OCR）技术从抓取的内容中提取POI名称和位置等关键信息。
- POI数据库更新：根据提取的信息，自动更新用户个人POI数据库，增加新的POIs或更新现有POIs的信息。
- 用户交互：允许用户直接搜索或通过链接添加新的POI到他们的数据库，并在个人地图上显示和管理这些POIs。

通过UPC模块，ItiNera系统能够确保用户在行程规划过程中使用的POI信息既个性化又具有最新性。UPC模块的设计体现了利用LLMs来处理和理解大规模、真实世界的数据，以及自动化地从这些数据中提取和更新对用户有价值的信息的能力。这种自动化的POI信息收集和更新机制，大大提高了行程规划服务的灵活性和用户体验，使用户能够基于最新的、个性化的信息来规划他们的城市探索行程。

RD模块（Request Decomposition模块）将用户请求包装在一系列指令和少量示例中，然后使用预训练的大型语言模型来解析这些指令和示例，从而生成一组结构化的子请求。每个子请求由四个关键部分组成：“pos”（正面条件）、“neg”（负面条件）、“mustsee”（必看项）和“type”（类型），这些部分分别指示用户在子请求中喜欢和不喜欢的内容、“mustsee”表明是否为必看项，而“type”可为“start”（起点）、“end”（终点）、“POI”（特定兴趣点）或“itinerary”（整个行程），表明子请求的目标是什么。
PR模块（POI Retrieval模块）的工作流程如下：
- 对用户请求进行编码：利用嵌入模型对用户请求中的正面（pos）和负面（neg）信息字段进行编码，生成相应的嵌入表示。
- 基于嵌入的检索：使用正面信息字段的嵌入表示来查询数据库中的POIs，选择那些与正面需求最匹配同时避开用户负面需求的POIs。
- 生成检索的POI集合：通过这种方法，PR模块能够从大量的POI数据中快速准确地筛选出最相关的POIs，为用户提供与其个性化需求最匹配的行程选项。

PR模块的设计充分考虑了大型语言模型（LLMs）在语言理解方面的先进能力，通过结合嵌入技术，能够有效地解决LLMs在处理大规模实际世界数据时遇到的上下文窗口大小限制问题。这一模块是ItiNera系统中关键的一环，它直接支持生成个性化且空间上连贯的城市行程，提高了行程规划的准确性和用户满意度。

SO模块（Spatial Optimization模块）的工作流程包括：
- 获取候选POI通过空间聚类和过滤：首先，根据检索到的POIs集合创建一个空间邻近图，使用距离矩阵定义节点（每个节点代表一个POI）之间的连接。如果节点之间距离小于特定的距离阈值，则它们之间会有边连接。然后，应用社区检测算法对这个图进行处理，将所有节点划分为多个互不相交的簇。迭代选择具有最高累计相似性得分的簇，直到选定的POIs数量达到预定义的阈值，这些POIs构成了针对用户请求的候选POIs。算法如下：

（空间聚类算法）

- 通过解决层次化TSP优化POI访问顺序：获得空间簇后，进一步优化候选POIs的访问顺序，确保行程在空间上连贯。这一过程首先涉及确定每个簇的访问顺序。然后，在每个簇内，通过解决具有起点和终点约束的TSP来确定POIs的访问顺序。具体而言，每个簇的起点和终点是基于相邻簇中POIs的接近程度来选择的。算法如下：

（层次化TSP优化POI访问顺序算法）

通过此种空间优化的方法，不仅提高了行程规划的效率，还确保了生成的行程能够更好地反映出用户的旅行偏好和实际旅行的逻辑性。通过SO模块，ItiNera系统能够生成在空间上连贯且逻辑合理的旅行路线，与用户的自然语言请求紧密对齐。通过SO模块优化的使用效果如下：

（其中ItiNera系统为左侧｜GPT-4 CoT规划结果右侧）

IG模块（Itinerary Generation模块）的工作流程包括：
- 从PR模块接收经过筛选和排列的POIs集合，这些POIs已经根据用户的需求和空间连贯性进行了优化。
- 结合用户的额外约束条件，如时间可用性、避免连续访问相同类型的地点（例如连续访问多家餐厅），以及确保场所在适当的时间被访问（例如不在早晨规划酒吧，或在晚上规划咖啡店）。
- 利用LLMs的高级推理和规划能力，选择一个最优的POIs子集，这个子集不仅在空间上连贯，还符合用户的其他需求和约束。简化Prompt如下：

（简化生成规划Prompt）

IG模块的目标是生成既空间连贯又符合用户复杂需求的高质量行程。这一模块的设计考虑到传统的优化算法在处理这种类型的复杂约束时可能变得过于复杂，并且缺乏多样性，这可能阻碍系统的部署和行程的多样性。因此，IG模块采用LLMs来生成最终行程，以解决这些挑战，提供更加个性化和实用的旅行规划方案。

实验部分：

实验设置
- 数据集：实验在包含四个中国城市的城市旅行行程数据集上进行，该数据集通过与领先的旅行机构合作收集，涵盖了125个顶级城市行程和727个兴趣点（POIs）。数据集的关键统计信息包括行程中包含的POIs平均数和相似度。其中四个城市统计数据如下：

（简化生成规划Prompt）

- 评估指标：设计了一系列基于规则和基于GPT的评估指标，以衡量生成行程的空间一致性、与用户需求的对齐程度等。
- 比较基线：ItiNera系统与包括传统IP方法、Ernie-Bot 4.0（中文LLM任务中表现最佳的模型），以及GPT-3.5等基线方法进行比较。
关键实验发现：
- 在线主观评估：通过TuTu在线OUIP服务进行在线主观评估，收集了来自107个用户的231个结果。这些评分随后用于提升系统，以增强用户体验。
- 消融实验：为了理解ItiNera系统中不同组件的影响，进行了Ablation Study。研究比较了ItiNera的几种变体，包括GPT-4 CoT + UPC、去除RD模块、去除PR模块、去除SO模块，以及使用GPT-3.5替代GPT-4的变体。其中以中国上海为例的数据集消融实验的数据如下：

（简化生成规划Prompt）

- 评估结果：ItiNera在所有指标上均优于比较基线，尤其在匹配度上。这证明了ItiNera在实现个性化用户体验方面的优越性。同时，消融实验的结果揭示了不同组件对系统性能的具体贡献。
结果分析：

实验结果表明，ItiNera系统能够有效生成个性化且空间一致的城市行程，直接从自然语言请求中出发。通过在线主观评估和消融实验，验证了ItiNera系统在实际场景中的有效性和各个组件的重要性。这些实验不仅为城市行程规划技术树立了新的基准，还为利用LLMs解决城市环境中的复杂问题开辟了新的途径。未来的研究将专注于多样化用户请求的分类，并进一步增强系统的可扩展性和实时性能，以更好地服务于TuTu在线服务不断增长的用户基础。

03

—

商业应用及影响

ItiNera系统已经应用于TuTu在线旅行服务，吸引了大量用户使用。这表明该系统具有很高的商业价值。此外，该研究也拓宽了AI在城市规划领域的应用范围，为未来的创新提供了新的思路。

同时，尽管ItiNera系统表现出色，但作者也指出了其局限性，如需要更多数据支持、提高实时性等。未来的研究方向包括进一步优化系统模块、处理更复杂的用户请求、扩大数据规模等。

04

—

结语–探索未来的旅程

随着人工智能技术的日新月异，我们正步入一个全新的旅行规划时代——一个由先进算法驱动，能够为每位旅行者量身定制独一无二旅行体验的时代。本文介绍的ItiNera系统，不仅展示了大型语言模型（LLMs）与空间优化技术结合的强大潜力，也为我们描绘了一个更加智能、更加个性化的旅行规划未来。

此外，邀请您在下方评论区留下您的想法和建议。您的每一次反馈，都将是我们不断进步和创新的动力🚀。

- 您希望ItiNera系统下一步应该如何进化？有没有特定的功能或改进点是您特别期待的？
- 分享您的梦想旅行目的地和期待的旅行体验，让我们看看ItiNera如何帮助实现它们。
- 如果您已经尝试使用过类似的旅行规划工具，您的体验是怎样的？有哪些是您觉得ItiNera可以借鉴的？
- 如果您对文中涉及大语言模型Pompt感兴趣，涉及到Prompt、表格和论文相关文件已经打包放到公众号【赛博詹特曼】，回复【20240303】获取，仅供学习交流使用。

文章内容来自于：

Synergizing Spatial Optimization with Large Language Models for Open-Domain Urban Itinerary Planning

https://arxiv.org/abs/2402.07204

城市旅行个性化定制：大型语言模型与空间优化的协同创新

作者52AI

作者 52AI

相关文章

神经算法推理

文本嵌入可以完美地编码文本吗？

超越直接关系：大语言模型的隐式推理能力研究

You missed

大模型开发实战出真知系列：跟着OpenAI官方学Prompt-认识篇

大模型开发实战出真知系列：简单了解LangChain Expression Language-实战篇

使用pipe作符提升Python代码效率：数据科学学习

大模型开发实战出真知系列：一文了解LangChain技术栈–认识篇