基于SAE特征优选和Bagging集成学习的油藏初期产能预测-AET-电子技术应用

基于SAE特征优选和Bagging集成学习的油藏初期产能预测

电子技术应用

徐振1，张望1，李兴亮1，龙军2

1.中国石油吐哈油田分公司；2.深圳鹏锐信息技术股份有限公司

摘要： 油藏初期产能受地质、工程和开发等多种因素影响，是一种复杂的非线性变化时间序列，传统采用单一模型进行预测的方法预测精度较低，数据适应能力较弱。提出一种基于稀疏自编码器（Sparse Auto-Encoder， SAE）和集成学习的油藏初期产能预测模型。首先利用SAE对影响初期产量的多种因素进行分析，自动提取含油饱和度、射孔段有效厚度、压裂加砂量、加砂强度和能量保持状态5维特征作为主控因素，然后分别采用线性回归（Linear Regression， LR）、支持向量回归（Support Vector Regression， SVR）和长短时记忆神经网络（Long Short-Term Memory， LSTM）3种方法建立预测模型进行初产预测，最后利用Bagging集成学习对3种方法的预测结果进行综合集成，从而获得最终的油藏初期产能预测结果。采用某特低渗油田实际数据开展验证试验，结果表明相对于单一LR、SVR和LSTM方法，所提方法的预测精度更高，数据适应能更强，具有较高的应用前景。

关键词： 稀疏自编码器特征选择集成学习产能预测支持向量回归

中图分类号：TP18；TE341 文献标志码：A DOI: 10.16157/j.issn.0258-7998.256701
中文引用格式： 徐振，张望，李兴亮，等. 基于SAE特征优选和Bagging集成学习的油藏初期产能预测[J]. 电子技术应用，2026，52(3)：84-90.
英文引用格式： Xu Zhen，Zhang Wang，Li Xingliang，et al. Prediction of initial reservoir productivity based on SAE feature optimization and Bagging ensemble learning[J]. Application of Electronic Technique，2026，52(3)：84-90.

Prediction of initial reservoir productivity based on SAE feature optimization and Bagging ensemble learning

Xu Zhen1，Zhang Wang1，Li Xingliang1，Long Jun2

1.Petrochina Tuha Oilfield Branch；2.Shenzhen Pengrui Information Technology Co.， Ltd.

Abstract： The initial productivity of oil reservoir is affected by many factors such as geology, engineering and development, which is a complex nonlinear time series. The traditional prediction method using a single model has low prediction accuracy and weak data adaptability. A prediction model of initial reservoir productivity based on sparse auto encoder (SAE) and ensemble learning is proposed. Firstly, SAE is used to analyze various factors affecting the initial production, and the five-dimensional characteristics of oil saturation, effective thickness of perforated interval, fracturing sand addition, sand addition intensity and energy retention state are automatically extracted as the main control factors. Then, the prediction models are established by using linear regression (LR), support vector regression (SVR) and long short-term memory neural network (LSTM) to predict the initial production. Finally, Bagging ensemble learning is used to comprehensively integrate the prediction results of the three methods, so as to obtain the final prediction results of the initial production of the reservoir. Using the actual data of an ultra-low permeability oilfield to carry out the verification test, the results show that compared with the single LR, SVR and LSTM methods, the proposed method has higher prediction accuracy, stronger data adaptability and higher application prospect.

Key words : sparse autoencoder；feature selection；integrated learning；productivity prediction；support vector regression

引言

油藏是我国的战略资源，在国家经济发展中起着举足轻重的作用。油藏初期产能的准确预测对于企业投资决策、合理开采方案制订以及生产环节优化等具有重要意义[1]。自六十年代以来，我国油藏初期产能预测经历了数值模拟法、机器学习法和深度学习法3个阶段[2]。数值模拟法通过对与油藏初期产量相关的参数进行分解，进而建立一系列模型对参数相互之间的关系进行描述，最终获得油藏初期产量的解析表达式，具有原理清晰、可解释性强和计算简单等优势[3]，但由于储层非均质性、生产以及工程等非线性因素难以采用准确的数学模型进行描述，导致数值模拟法的预测精度有限[4]。近年来，随着我国油气田数字化、信息化程度的提升，油气田产业积累了大量的地质数据、生产数据和工程数据等，数据驱动的机器学习类方法得到了科研人员的广泛关注。机器学习法以线性回归(Linear Regression, LR)、支持向量回归(Support Vector Regression, SVR)和人工神经网络等方法为代表[5]，能够从历史数据中自动挖掘出与油藏产量有关参数之间隐藏的规律性信息和变化趋势信息，从而在降低建模难度的同时提升对非线性数据的适应性[6]。文献[7]利用自回归移动平均模型(ARMA)对水驱油藏井组内产油量和注水量之间的关系进行建模表征；文献[8]筛选了井深、气体饱和度和渗透率等8个参数作为页岩气产量的主控因素，并采用SVR模型对8个参数与页岩气产量之间的关系进行建模，获得了较高的预测精度；文献[9]将ANN引入油气产量预测领域，分析了ANN和SVR在面对非线性油气数据时的性能差异，证明了ANN在油藏初期产量预测领域具有较高的潜能。相对于数值模拟方法，机器学习方法不需要复杂的理论推导，且能够根据数据中隐含的地质、工程和生产信息自动学习和调整，因此具有更高的灵活性和数据适应性。然而油气数据本质上是一种随时间变化的时间序列，而机器学习类方法对时间不敏感，建模过程中忽略了时间维度对产量变化的影响，因此预测过程中会出现预测偏差[10]。以长短时记忆神经网络(Long Short-Term Memory Network, LSTM)和卷积神经网络(Convolutional Neural Network, CNN)为代表的深度学习方法能够有效挖掘数据中隐含的周期性和趋势性时间信息，同时能够提取更高阶、更丰富的特征对油藏产量与工程参数之间的复杂关系进行描述[11-12]，文献[13]考虑道页岩气开发过程中高密度钻井条件限制，建立LSTM模型对页岩气产量的时序关系进行描述并将其应用至加拿大Alberta地区的页岩气产量预测；文献[14]提出一种麻雀搜索算法优化的时域卷积神经网络(TCN)的预测模型，解决了水驱油田单井产量波动大、预测困难的问题。深度学习方法虽然能够获得较高的预测准确度，但是需要大量的训练数据用于模型参数寻优，数据依赖性将强且运算量较大，限制了该类方法在实际中的应用[15]。

当前已有研究均是采用单一模型进行油藏初期产能预测，近年来集成学习理论的发展表明，单个模型的预测性能必然存在局限性，通过将多个模型进行集成能够有效提升对复杂非线性问题的建模分析能力。基于此，本文提出一种基于稀疏自编码器(Sparse Auto-Encoder, SAE)和集成学习的油藏初期产能预测模型。首先利用SAE进行主控因素选择，实现数据降维的同时降低后续预测模型的复杂度；然后分别建立LR、SVR和LSTM 3种预测模型进行产量预测，最后利用Bagging集成学习对3种方法的预测结果进行综合集成从而获得最终的油藏初期产能预测结果。通过某特低渗油田实际数据对所提方法的性能进行验证。

本文详细内容请下载：

https://www.chinaaet.com/resource/share/2000007009

作者信息：

徐振1，张望1，李兴亮1，龙军2

（1.中国石油吐哈油田分公司，新疆哈密 839000；

2.深圳鹏锐信息技术股份有限公司，广东深圳 518000）

原创声明：此内容为AET网站原创，未经授权禁止转载。

相关内容