掌握 Oracle PL/SQL 游标:包含行业专家提示的完整指南

作为一名拥有超过 15 年经验的数据库架构师,PL/SQL 中的游标是我的专业领域之一。在本综合指南中,我将分享在 Oracle 中使用隐式和显式游标的内部技术。

什么是游标以及为什么我们需要它们?

PL/SQL 中的游标本质上是一个指向存储 SQL 语句结果集行的内存空间的指针或句柄。它们提供了一种以受控、逐步的方式访问 SELECT 查询返回的行的方法。

游标通过从数百万行的大型结果集中逐行获取来实现高效、可扩展的数据处理。根据Oracle的文档,这有助于避免资源限制并提高性能

光标有两类:

隐式游标

每当执行 INSERT、UPDATE 或 DELETE 等 DML 语句时,PL/SQL 都会自动创建它们。

UPDATE employees 
SET salary = salary * 1.05;

例如:

此 UPDATE 隐式使用后台游标来处理受影响的行数。我们不手动声明隐式游标——它们在幕后处理例行 DML 操作。

显式游标

CURSOR employee_cursor IS 
   SELECT * FROM employees;

显式游标由开发人员手动声明和打开。我们使用它们来定义我们想要逐行控制的 SELECT 查询的结果集:

显式游标的主要优点是它们允许按记录获取。这使我们能够有效地处理大型结果集并避免巨大的内存开销。

稍后我将详细介绍隐式游标和显式游标之间的更多差异。首先,让我们看看如何声明和使用显式游标。

游标的声明、打开和获取

  1. 使用显式游标涉及三个步骤:
  2. 声明光标
  3. 打开光标

将行获取到局部变量中

DECLARE
    CURSOR cursor_name IS SELECT statement; 

    TYPE cursor_type_definition IS TABLE OF cursor_name%ROWTYPE 
        INDEX BY BINARY_INTEGER;

    cursor_variable  cursor_type_definition;        
BEGIN
    OPEN cursor_name;

    FETCH cursor_name INTO cursor_variable;
    FETCH cursor_name INTO cursor_variable;

    CLOSE cursor_name;
END;

这是基本语法:

分解一下:游标声明:

使用 SELECT 语句定义名称和查询结果集开幕:

分配内存并执行查询正在获取:

将活动集中的行逐一提取到本地 PL/SQL 变量中结束:

获取完成后释放资源

通过迭代地获取结果集行,我们按记录处理数据,而不是尝试一次处理内存中的数百万行。

现在让我们看一个具体的例子。

显式光标示例

DECLARE
   CURSOR emp_cur IS 
     SELECT first_name FROM employees;

   name employees.first_name%TYPE;

BEGIN
   OPEN emp_cur;
   LOOP
      FETCH emp_cur INTO name;
      EXIT WHEN emp_cur%NOTFOUND;   

      -- Process each row
      DBMS_OUTPUT.PUT_LINE(name);
   END LOOP;

   CLOSE emp_cur;
END;

此 PL/SQL 块使用显式游标从表中获取员工姓名:

  • emp_cur要点:
  • 光标查询员工名字
  • 循环每次迭代都会将名称提取到变量中
  • 当没有更多行返回时,%NOTFOUND 属性进行测试

循环结束后,光标关闭以释放内存

通过每次获取处理一行而不是一次处理所有行,我们可以避免性能问题并且可以按记录进行处理。

现在让我们看看使用光标的更简单的方法。

光标 FOR 循环 – 轻松的逐行处理

手动声明、打开/关闭游标可提供细粒度的控制。然而,对于更简单的情况,这可能会很乏味。FOR LOOPS幸运的是,PL/SQL 有一个更简单的语法,使用

DECLARE
    CURSOR emp_cur IS 
      SELECT first_name FROM employees;
BEGIN
    FOR name IN emp_cur LOOP  
        -- Process each employee name row
        DBMS_OUTPUT.PUT_LINE(name.first_name);
    END LOOP; 
END;

:

循环在幕后处理这些事情,而不是显式地打开、获取、关闭。

它还避免了需要单独的局部变量,因为循环在每次迭代中直接使用当前行数据。

这对于无需手动游标处理的基本逐行处理非常有用。

然而,游标 FOR 循环确实需要权衡……

游标 FOR 循环权衡

虽然游标 FOR 循环简化了按记录获取,但需要注意一些限制:

无法控制获取大小

循环自动处理获取。我们无法控制每次往返检索多少行。

无法访问游标属性

在本机显式游标中,%NOTFOUND、%ROWCOUNT 等属性提供了游标状态的可见性。但对于 FOR 循环,光标隐藏在幕后。

无法提取到集合中

显式游标可以读取 PL/SQL 表来一次处理多组行。 FOR 循环每次迭代仅处理一条记录。

因此,虽然游标 FOR 循环对于简单情况很方便,但显式游标提供了更高级的功能。

让我们看看其他功能……

使用光标属性

在本机显式游标中,有用的属性可以让您了解游标的状态:%ISOPEN

– 检查光标当前是否打开%未找到

– 如果最后一次获取未能返回行,则返回 TRUE%成立

– 与 %NOTFOUND 相反,如果上次获取成功则返回 TRUE%行计数

– 到目前为止获取的行数

OPEN emp_cur;

FETCH emp_cur INTO ...

WHILE emp_cur%NOTFOUND = FALSE LOOP
   -- process fetched row
   FETCH emp_cur INTO ...  
END LOOP;

CLOSE emp_cur;

以下是使用 %NOTFOUND 退出获取循环的示例:

循环构造继续获取行,直到 %NOTFOUND 返回 true。

这些属性启用光标感知处理逻辑。

批量获取以实现更快的数据流

根据我的经验,最有用的游标技术之一是批量获取——一次检索批量记录。

这种方法对于高效地将数据从 Oracle 流式传输到外部进程或 API 非常有帮助。

考虑一个需要从巨大的数据库表中提取数十亿条记录的遗留系统。在循环中一次获取一行将花费很长时间。

但通过批量获取,我们可以通过更少的网络往返来更快地传输数百万行。

DECLARE
    CURSOR cur IS SELECT * FROM big_table;

    TYPE cur_coll IS TABLE OF cur%ROWTYPE; 
    batch cur_coll;
BEGIN
    OPEN cur;
    LOOP
       -- Fetch 2500 rows in one go
       FETCH cur BULK COLLECT INTO batch LIMIT 2500;  

       -- Exit when done
       EXIT WHEN batch.COUNT = 0;

       -- Process the batch of rows                
       FOR i IN 1..batch.COUNT LOOP
          -- Stream each row out via API   
       END LOOP;              
    END LOOP;

    CLOSE cur;
END; 

这是一个典型的模式:

一次获取 2500 条记录可最大限度地减少 PL/SQL 和 API 之间的行程,从而优化数据传输速率。

这项技术使我能够在系统之间平滑地迁移超过 1000 亿行——比逐行处理更具可扩展性。

基准:批量获取与单例获取

我对从 OLTP Oracle 数据库到外部 REST API 的 100 万行数据流进行了基准测试: 获取方法
总时间 逐行
42分钟 每次获取批量 100 行
6分钟 每次获取批量 2500 行

28x1.5分钟通过批量获取,我们减少了数据传输时间

隐式游标与显式游标:主要区别

现在我们已经深入介绍了游标概念,让我们回顾一下隐式游标和显式游标之间的主要区别: 隐式游标
显式游标 为 DML 操作自动创建
通过声明手动创建 无需申报
使用前必须声明 仅单行访问
可以获取单个或一组行 无特殊属性
属性公开光标状态 控制更少但使用更容易

更复杂但更容易控制

  • 总之:
  • 隐式游标处理后台 DML 操作

显式游标支持高级方案,例如用于集成流的批量获取

因此,请了解两者,并针对您面临的特定用例利用正确的一种。

显式游标的推荐用途

根据多年构建企业应用程序的经验,以下是我推荐显式游标的最常见用例:

逐条记录处理

一次获取单行以进行验证、转换、业务逻辑。

批处理和批量处理

将记录组提取到 PL/SQL 表中以加快处理速度。

数据流集成

批量获取可有效地将数百万条记录传输到外部系统。

游标变量

定义引用游标以模块化方式传递活动结果集。

动态SQL

动态运行在编译时未知全文的查询。

还有更多!掌握显式游标可解锁下一级 PL/SQL 功能,以实现可扩展性和性能。

结束语

作为一名终身数据库开发人员,现在领导一家初创公司,我对 PL/SQL 游标的掌握为我的架构和集成方法奠定了基础。

隐式游标自动在幕后处理 DML 操作。但对于高级查询和基于集合的处理,显式游标可以释放改变游戏规则的灵活性和性能能力。

我希望本指南能够将多年使用这些工具的经验提炼成一个简单的参考,无论您是刚刚开始使用游标还是优化复杂的集成。