数据驱动型报童模型研究

 2022-05-23 20:51:36

论文总字数:40466字

\documentclass[bachelor,nocolorlinks, printoneside]{seuthesis} % 本科

\usepackage{CJK,CJKnumb}

\usepackage{amsmath}

\usepackage{amsfonts}

\usepackage{bm}

\usepackage{algpseudocode}

\usepackage{subfigure}

\usepackage{Picinpar}

\usepackage{amssymb}

\usepackage{graphicx}

\usepackage{float}

\usepackage{flafter}

\usepackage{amsthm}

\usepackage{ccmap}

\usepackage{multirow}

\usepackage{caption}

\renewcommand{\proofname}{\bf{证明}}

\newtheorem{theorem}{定理}[section]

\newtheorem{lem}{引理}[section]

\newcommand{\bmb}[1]{\bar{\bm{#1}}}

\newcommand{\bmh}[1]{\hat{\bm{#1}}}

\newcommand{\bmt}[1]{\tilde{\bm{#1}}}

\newcommand{\bmo}[1]{\overline{\bm{#1}}}

\newcommand{\nmbs}[1]{{\mbox{\scriptsize{$#1$}}}}

\newcommand{\nmbst}[1]{{\mbox{\scriptsize{$\tilde{#1}$}}}}

\newcommand{\nmbss}[1]{{\mbox{\tiny{$#1$}}}}

\def\w{\tilde{w}}

\def\n{\tilde{n}}

\def\k{\tilde{k}}

\def\l{\tilde{\ell}}

\newcommand{\ep}[1]{\mathbb{E}_{\mathbb{P}}\left[#1\right]}

\newcommand{\eq}[1]{\mathbb{E}_{\mathbb{Q}}\left[#1\right]}

\newcommand{\epbar}[1]{\mathbb{E}_{\bar{\mathbb{P}}}\left[#1\right]}

\newcommand{\epo}[1]{\mathbb{E}_{\mathbb{P}_0}\left[#1\right]}

\newcommand{\epl}[1]{\mathbb{E}_{\mathbb{P}_l}\left[#1\right]}

\newcommand{\epn}[1]{\mathbb{E}_{\mathbb{P}_n}\left[#1\right]}

\newcommand{\epv}[1]{\mathbb{E}_{\mathbb{P}_v}\left[#1\right]}

\newcommand{\pp}[1]{\mathbb{P}\left[#1\right]}

\newcommand{\ppo}[1]{\mathbb{P}_0\left[#1\right]}

\newcommand{\ppl}[1]{\mathbb{P}_l\left[#1\right]}

\newcommand{\ppn}[1]{\mathbb{P}_n\left[#1\right]}

\newcommand{\ppv}[1]{\mathbb{P}_v\left[#1\right]}

\newcommand{\ppdag}[1]{\mathbb{P}^\dag\left[#1\right]}

\newcommand{\pq}[1]{\mathbb{Q}\left[#1\right]}

\newcommand{\ppbar}[1]{\bar{\mathbb{P}}\left[#1\right]}

\def\vec{\text{vec}}

\DeclareMathOperator*{\argsup}{\arg\!\sup}

\DeclareMathOperator*{\arginf}{\arg\!\inf}

\newcommand{\1}[1]{\mathds{1}{\left(#1\right)}}

\begin{document}

\categorynumber{000}

\UDC{000}

\secretlevel{公开}

\studentid{07315132}

\title{数据驱动型鲁棒库存优化}{}{Data-Driven Robust Inventory Optimization}{subtitle}

\author{黎俊}{Jun Li}

\advisor{赵璇}{副教授}{Xuan Zhao}{Prof.}

\major[12em]{统计学}

\department{数学学院}{department name}

\duration{2019年1月—2019年5月}

\address{东南大学数学学院}

\maketitle

\begin{abstract}{库存管理,鲁棒优化,数据驱动型优化,K-means聚类,Wasserstein测度}

库存管理是零售企业控制成本和保证销量的最核心运营环节,商品需求的不确定性一直以来都是库存管理的核心难点,如何针对商品未来需求不确定性建立更为鲁棒的库存决策以有效控制库存成本和销售损失是目前大多数零售企业所面临的难题之一。

本文以两阶段随机规划模型为基础,提出了一种新的基于多零售商-多仓库的两阶段随机规划、库存鲁棒优化模型,结合改进的K-means聚类方法和Wasserstein测度,提出两类新的数据驱动型分布不确定集。一方面,新模型能够保证商品需求真实分布一定存在于分布不确定集之中,鲁棒优化技术能够保证企业在最坏情况下的库存成本和销售损失最低;另一方面,本文证明了在两类分布不确定集下,新模型能够转化为线性规划问题,线性规划形式能够保证新模型能在多项式时间内求解。

最后,利用北京好邻居零售企业真实销售数据检验两个模型,结果表明:随着改进的K-means聚类方法划分类别数量增多,K-means模型最优成本逐渐减小,对应的模型求解时间逐渐增大;随着$\theta$取值的增大,Wasserstein分布不确定集中需求真实分布的偏差逐渐增大,因此Wasserstein模型最优成本逐渐增大。我们对比两个模型后发现:K-means模型的最优成本显著高于Wasserstein模型的最优成本,然而K-means模型求解时间显著小于Wasserstein模型求解时间。因此我们得出结论:K-means模型可以显著改善模型求解时间,可以在牺牲部分成本的情况下应用于大规模优化问题中;Wasserstein模型可以在小样本情况下有效控制企业库存成本。

\end{abstract}

\begin{englishabstract}{Inventory planning, robust optimization, data-driven optimization, K-means clustering, Wasserstein metric}

Inventory planning is the most core operation part for retail enterprises to control costs and ensure sales volume, uncertainty of commodity demand has always been the core difficulty of inventory planning. Therefore, how to establish more robust inventory decision-making to effectively control inventory costs and sales losses is one of the difficulties faced by most retail enterprises.

Based on the two-stage stochastic programming model, we present a new model combining two-stage stochastic programming with multi-retailer-multi-warehouse and robust inventory optimization, and present two types of data-driven distributionally ambiguity sets with enhanced K-means clustering method and Wasserstein metric. On the one hand, the new model can ensure that the real demand distribution of goods must exist in the ambiguity sets and robust optimization technology can ensure the lowest cost of enterprises in the worst case. On the other hand, we prove that the model can be transformed into a linear programming problem under these two types of distributionally ambiguity sets and can be solved in polynomial time.

Finally, two models are tested by real sales data of Beijing good neighbor retail enterprises. The results show that with the increase of clusters partitioned by enhanced K-means clustering method, the optimal cost of K-means model decreases gradually, and the solving time of the corresponding model increases gradually. With the increase of the value of $\theta$, the dispersion of demand distribution on Wasserstein ambiguity set increases gradually, as a result, the optimal cost of Wasserstein model increases gradually. After comparing the two models, we find that the optimal cost of K-means model is significantly higher than that of Wasserstein model, but the solving time of K-means model is significantly shorter than that of Wasserstein model. we conclude that the K-means model can significantly improve the solving time of the model and can be applied to large-scale optimization problems at the expense of part of the cost. Wasserstein model can effectively control the inventory cost of an enterprise under the condition of small sample size.

\end{englishabstract}

\tableofcontents

\begin{Main}

\chapter{引言}

\section{研究背景}

库存管理一直都是零售企业控制成本和保证销量的最核心运营环节之一。作为零售行业与大数据以及互联网技术融合的新形式,新零售时代已经到来。一方面,零售行业的品类及销售特征已经发生了变革:首先,商品的品类数量成指数型增长\cite{wangcan2018};再者,商品的多元化销售渠道(如线上、线下以及手机APP等立体化销售)已经成为主流销售模式,该模式在不断加速商品的销售频率,而同时商品品类的销售生命周期也在不断缩短\cite{lizhi2016}。最后,随着物联网技术的发展,商品的物流效率已经达到了前所未有的高度,并且还在进一步提速。另一方面,零售行业的数据环境也产生了新的变化:首先,由于商品销售生命周期的变短,同一产品的长期历史销量数据已经越来越少\cite{Akcay2011};同时,越来越多的零售企业已经开始采集与销售相关的数据(如京东,Amazon-Go,\cite{wangmozhu2019}),如天气,商品特征,目标客户画像,甚至柜台停留时间等等,以期更好的理解客户购买动机与购买行为模式以提升销售。

这些新零售时代的变革给零售企业的库存管理带来了新的挑战与机遇。

\noindent (1). 商品需求的不确定性一直以来都是库存管理的核心难点,目前大多数企业主要还是基于历史销量信息使用统计预测方法估计出商品未来销量,并以此确定库存补货决策。而在商品销售周期日趋变短的新零售背景下,基于大量长期的销售数据来对需求进行精准统计预测已经越来越不现实\cite{jiaozhilun2018}。因此,如何针对商品未来需求不确定性建立更为鲁棒的库存决策以有效控制库存成本和销售损失是目前大多数零售企业所面临的难题之一。

\noindent (2). 为了应对新零售时代商品的销售频率不断提升、物流不断加速的特点,零售企业的库存决策必须是数据驱动或在线的。基于新零售背景下数据环境的变革,如何更为全面有效的利用需求相关的属性或特征等协变量信息并结合有限的销售数据来尽可能精准的刻画未来需求的状态,以提升库存决策的精准性,也是目前各零售企业库存管理所关心的重要课题之一。

从文献研究的角度,虽然库存管理一直都是运营管理领域的研究热点,然而在面对上述出现的新挑战形势下,目前相关文献尚有以下不足。

总体而言,目前绝大多数库存优化模型都基于给定的需求概率分布,这种分布假定对于实际应用往往是苛刻的,并且会对模型的使用性大打折扣,并且模型求解算法都依赖于给定需求分布;数据驱动库存优化的文献也相对较少,并都主要考虑了单产品的情形;基于分布鲁棒优化的库存优化模型研究还不多,关于任意需求分布的数据驱动型产品库存优化问题还没有得到较好研究。进一步,产品多周期的数据驱动分布鲁棒库存优化问题,以及数据驱动分布鲁棒优化的库存模型的学习机制等都还没有得到相应研究。

本文在库存优化和鲁棒优化框架下,从“基于随机需求的库存管理”,“库存优化的数据驱动机制”,“鲁棒库存优化”以及“分布鲁棒优化、数据驱动模型及学习机制”等四个方向来分析国内外研究现状与发展动态。

\subsection{基于随机需求的库存管理}

库存优化及管理一直都是运营管理领域的重点研究问题,目前大部分的库存优化模型都是基于随机需求或随机过程而展开研究,即给定商品需求分布全信息,利用需求总体分布进行库存优化。

Caro和Gallien利用历史销量数据预测零售店销量,进一步利用预测数据建立混合整数规划模型,通过优化库存分配最大化整体预测销售额,解决了零售网络中有限数量库存的分配问题\cite{Caro2010}。张金隆等研究了需求服从泊松分布、提前期等于常数、基于$(S-1,S)$订货策略的随机库存模型,提出当库存降低到预定水平,则预留存货以满足关键需求的控制策略,并给出了不同优先级备件服务水平的计算方法\cite{zhangjinlong2003}。马俊等结合库存控制模型与拍卖理论,针对采购物品反向拍卖方式的特殊性,结合最优拍卖的相关理论,研究了随机需求下$(r,Q)$系统的库存控制问题,并利用服务水平中供给率这一概念,给出了求解随机需求下拍卖采购品的订货批量和再订货点的方法\cite{majun2009}。Guerrero等考虑随机需求、批量和订单更新政策,以及医疗保健设置的特定方面,以最小化整个系统的库存值为目标,提出了一种寻找最优联合库存控制策略的方法,并对法国某大学医疗中心单仓库多零售商输液配送系统进行改进,有效提高了库存利用率\cite{Guerrero2013}。Chen等利用当前时期的价格附加一个随机项估计需求,同时考虑线性订购成本、库存持有和积压的处置成本以及库存不足损失销售的罚款成本,制定一个有效的启发式策略作为联合定价,订购和初值策略,解决了有限时间内固定寿命易腐产品的联合定价与库存控制问题\cite{Chen2014}。Bimpikis和Markakis考虑一个单周期、多地点的报童模型,其中不同地点面临独立的、相同分布的需求以及线性持有和延期交货成本, 建立了一类重尾需求分布,其幂律渐近衰减率由参数确定\cite{Bimpikis2015}。

随机库存优化研究中改进优化模型或者构造新颖的启发式算法/策略解决库存优化问题也是近年的趋势。汪达钦和霍佳震考虑有限时域下面对确定和随机两种需求类型的产品库存系统,使用动态规划法构建该系统的动态模型以求得利润最大化下的最优订货和分配策略\cite{wangdaqin2010}。Bernstein等提出了一个简单的启发式算法来解决单时期系统中的联合库存和定价问题,解决了加法和乘法需求形式的计算复杂问题,并证明启发式方法可以应用于包括具有固定订购成本或固定批量大小的系统在内的多种库存系统\cite{Bernstein2016}。

除此,Zhang以及He等分别从不同角度考虑了一个单仓库多零售商库存联合补给的合作博弈优化问题。前者重点关注合作博弈下费用的合理分配问题\cite{Zhang2016},而后者则考虑了一个可分离凹函数最大化的问题,证明了如果联合设置成本是一个归一化和非归一化的子模函数,则该合作博弈是子模的\cite{He2012}。 Jasin和Sinha讨论了给定随机需求下电商多产品联合订货及分配问题,由于问题较高的复杂度,他们提出了一种基于线性规划的逼近算法来求解模型\cite{Jasin2015}。

\subsection{库存优化的数据驱动机制研究}

在实际中需求信息是不断变化的,因此文献中也有少量关于数据驱动型库存优化模型的研究,这些文献主要通过某些算法利用历史数据估计或者调整需求预测情况,但是基本都是针对单产品库存问题:Burnetas和Smith基于报童模型考虑了一个单产品单周期库存订货及定价联合优化问题,在一定的需求概率分布条件下,给出了可以基于数据更新调整的订货和定价策略,并证明了该策略对最优解的收敛性\cite{Burnetas2000}。Mersereau考虑了库存订货问题中需求数据被库存决策影响以及库存不准等重要特征,提出了一种基于贝叶斯学习的需求分布估计方法并应用与库存补货问题,该方法同样针对单一产品问题\cite{Mersereau2015}。Saghafian和Tomlin考虑了一个重复的报童模型设置,并提出了一种基于最大熵的贝叶斯技术,它允许管理者有效地将需求观测与分布信息以矩或尾的边界形式结合起来,并对需求分布形成一种信度,并利用现有数据和部分分布信息随时间更新需求分布,推导出更新机制的一个解析解\cite{Saghafian2016}。

\subsection{鲁棒库存优化研究}

常规鲁棒优化是指:给定一个不确定性最优化问题(目标函数、决策、不确定变量及约束条件等)以及不确定变量的变动范围(不确定集),当变量在不确定集内任意取值时,要求决策的约束条件都被满足,并且在此前提下对不确定集内的最坏情形最优化目标函数值。现有研究成果表明,当适当选取不确定集时,一般线性规划问题所对应的常规鲁棒性最优化模型可以等价地转化为多项式时间内可解的凸规划问题。

孙彩虹在报童仅获知不确定需求的均值与方差的假设下建立了联合定价、订货的鲁棒优化模型,并在适当的条件下给出了联合决策的闭环最优解\cite{suncaihong2014}。Ardestani和Delage研究了多面体不确定集上分段线性函数的鲁棒优化问题,提出了一种新的基于嵌入混合整数线性规划的近似构造方案,并将该方案与基于仿射决策规则的方法联系起来,建立多时期库存问题的鲁棒优化模型\cite{Ardestani-Jaafari2016}。Lim 和Wang针对订货能力受限的多产品、多周期库存管理问题,提出了一种基于收益目标的常规鲁棒优化方法,假设每个时期的每个产品的需求都有一个不确定性集,它只取决于一个参考值和需求的界限,目标是找到一个订单政策,最大化所有不确定性集的规模,使得所有需求都将导致总成本低于预先指定的成本目标\cite{Lim2016}。Natarajan 等利用二阶分段统计量度量分布不对称性的方法,利用均值、方差和半方差信息,证明了三点分布满足最坏情况下的期望利润,并给出了分布鲁棒订货量的闭式表达式。数值实验表明,非对称信息显著降低了预期的利润损失;在汽车零部件需求数据的计算实验中,证明了包含分区统计的分布鲁棒模型优于仅使用协方差信息的模型\cite{Natarajan2017}。

\subsection{分布鲁棒优化、数据驱动模型及学习机制研究}

虽然常规鲁棒性最优化模型具有计算高效性,但与基于概率分布的随机规划模型相比,其缺陷在于模型无法有效利用宝贵的概率分布信息。分布鲁棒性最优化则有机整合了随机规划与鲁棒性最优化思想。它是将基于给定概率分布的随机规划模型推广至不确定概率分布情形的一种抵抗分布不确定性的最优化方法。分布鲁棒性最优化通常是在一类给定分布信息特征的概率分布集合,即在分布不确定集下,对最坏分布情形的目标值进行最优化。从建模的角度,分布鲁棒性最优化方法最大的优势在于不但利用了概率分布信息,同时又具备对抗分布不确定性的鲁棒性机制。从计算的角度,分布鲁棒性最优化模型一般要比常规鲁棒性模型结构更复杂,但现有的研究表明:单阶段线性规划问题所对应的分布鲁棒性最优化模型,在一些特定的分布集结构下,能够基于一般化锥规划对偶理论实现模型的多项式时间求解\cite{Wiesemann2014}。

在数据科学不断发展的背景下,数据驱动鲁棒优化模型正在成为分布鲁棒优化理论的重要研究热点。最近,Esfahani和Kuhn将Wasserstein-distance引入数据驱动鲁棒优化,并从期望值目标研究了基于Wasserstein-distance的分布鲁棒优化问题,证明了对于单阶段问题,这类Wasserstein-distance的数据驱动分布鲁棒优化模型可以等价转化为多项式可解的凸优化问题\cite{Esfahani2018}。然后,基于Wasserstein-distance的两阶段分布鲁棒优化问题同样还是NP-Hard,并且由于Wasserstein-distance是基于全样本的,因此线性仿射决策规则会导致其产生大量的辅助变量,因而无法应用到该类问题上。另一方面,Perakis等提出一类基于K-means的两阶段数据驱动分布鲁棒优化的生产与定价模型,并该方法可以基于线性仿射决策规则对所构造的两阶段分布鲁棒优化进行逼近求解\cite{Perakis2019},然而该方法的缺陷在于损失了大量具体样本分布信息。

最后,关于分布鲁棒优化的学习机制问题,目前学界还没有较为正式的研究,文献中只有Esfahani和Kuhn在其论文的最后讨论部分强调了对于Wasserstein-ball 进行学习是一个非常重要然而也是非常困难的问题,并指出一种较为实用的方法可能是在样本量允许的前提下应用交叉验证通过大量样本外验证计算来选取最优的模型\cite{Esfahani2018}。

\section{基本模型}

考虑如下一个包含零售门店和仓库的零售企业分布系统,其中零售门店表示为$[I] = \{1,\dots I\}$,仓库表示为$[J] = \{1,\dots, J\}$。假定每个零售门店只销售单一品类的商品,每一个零售门店$i \in [I]$ 都面临一个该商品的随机需求$v_i$。

在第一阶段,即在每一个零售门店观察到随求之前,零售企业决策每一个仓库$j$从供应商处订购的商品数量$y_j$,其中,商品单价为$c_j$。

在第二阶段,即订货完成之后,仓库中的货物将被分配到各个零售门店,其中$x_{ij}$表示从仓库$j$运送到零售门店$i$的商品数量,从仓库$j$运送到零售门店$i$的单个商品的运输费用表示为$s_{ij}$。对每一个零售门店$i$,如果各个仓库分配到该零售门店的总商品数量超过该商品的的需求$v_i$,对于超出需求部分的商品,每一件商品都会使零售门店产生额外的储存成本$h_i$;另一方面,如果各个仓库分配到该零售门店的总商品数量低于该商品的的需求$v_i$,对于未满足需求部分的商品,每一件商品都会对零售门店产生机会成本$p_i$,仓库中剩余的商品不产生储存成本。

我们提出如下基础的两阶段随机规划模型,在这个模型中,$y_j,j \in [J]$,表示第一阶段决策变量,$\bm{v}$为服从分布$\mathbb{P}$的随机变量,表示随机需求。目标是最小化第一阶段的总费用和第二阶段的期望费用:

\begin{equation}\label{total_cost}

\sum_{j \in [J]} c_j y_j \mathbb{E}_{\mathbb{P}}[Q(\bm{y}, \bm{v})]

\end{equation}

其中,

剩余内容已隐藏,请支付后下载全文,论文总字数:40466字

您需要先支付 80元 才能查看全部内容!立即支付

该课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找;