GaussDB(DWS)数据仓库性能压测与调优实战：从0到1全记录

📅 2026/6/30 4:26:52 👁️ 次浏览

创建DWS集群登录华为云控制台 “数据仓库服务GaussDB(DWS)”点击“创建数据仓库集群”。关键配置参数分享参数推荐值说明计费模式按需计费演练完就释放省钱区域华北-北京四选离你最近的产品类型云数仓标准版够用节点规格 dwsx2.xlarge 最小规格即可热数据存储 20G 测试够用节点数量 3 分布式体验网络配置虚拟私有云新建一个VPC如vpc-dws子网选对应子网安全组自动创建公网访问现在购买带宽选1Mbit/s管理员密码设置一个密码大小写字母数字特殊字符一定要记住后面连数据库要用连接DWS数据库gsql-d gaussdb-h公网IP-U dbadmin-p8000-r-W你的密码成功连接后会看到postgres提示符构造测试数据创建测试表-- 创建订单表模拟业务场景CREATETABLEorders(order_idBIGINTPRIMARYKEY,user_idBIGINT,product_idBIGINT,order_amountDECIMAL(10,2),order_statusVARCHAR(20),created_atTIMESTAMP,updated_atTIMESTAMP)DISTRIBUTEBYHASH(order_id);-- 创建用户表CREATETABLEusers(user_idBIGINTPRIMARYKEY,user_nameVARCHAR(100),user_phoneVARCHAR(20),user_statusVARCHAR(20),register_timeTIMESTAMP)DISTRIBUTEBYHASH(user_id);DISTRIBUTE BY HASH是指定分布键数据会按这个字段的哈希值分散到不同节点。选错分布键会导致数据倾斜影响性能。插入测试数据-- 插入100万用户INSERTINTOusersSELECTgenerate_series(1,1000000),user_||generate_series(1,1000000),1||lpad(generate_series(1,1000000)::text,10,0),CASEWHENrandom()0.2THENactiveELSEblockedEND,now()-(random()*interval365 days);-- 插入1000万订单分批插入避免事务过大INSERTINTOordersSELECTgenerate_series(1,10000000),(random()*9999991)::BIGINT,(random()*99991)::BIGINT,(random()*10001)::DECIMAL(10,2),CASEWHENrandom()0.9THENpaidWHENrandom()0.7THENshippedWHENrandom()0.5THENpending_paymentELSEcompletedEND,now()-(random()*interval180 days),now()-(random()*interval30 days);插入1000万条数据可能需要几分钟到十几分钟收集统计信息这是最容易忽略但最重要的一步——没有统计信息优化器就不知道数据分布生成的执行计划可能很烂。经验表明10%左右的性能问题就是因为没收集统计信息。ANALYZEorders;ANALYZEusers;生成WDR性能报告WDRWorkload Diagnosis Report是DWS自带的性能诊断工具类似Oracle的AWR。它会定期采集数据库性能快照然后生成两份快照之间的性能对比报告。开启WDR快照-- 开启WDR功能默认开启SETenable_wdr_snapshoton;-- 手动创建快照管理员权限SELECTcreate_wdr_snapshot();查看已有快照SELECT*FROMdbms_om.snapshotORDERBYsnapshot_idDESCLIMIT5;生成WDR报告WDR报告包含的核心内容Top SQL by Elapsed Time最耗时的SQL排名等待事件分析数据库在等什么资源磁盘I/O、锁等慢SQL定位与分析直接查TOP慢查询SELECTquery_id,substring(query,1,100)ASquery_preview,calls,total_time/callsASavg_ms,rowsFROMdbe_perf.statement_historyWHEREstart_timenow()-interval1 hourORDERBYtotal_timeDESCLIMIT10;使用EXPLAIN分析执行计划-- 查看执行计划并实际执行推荐能看到真实耗时EXPLAINANALYZESELECT*FROMordersWHEREuser_id12345;实例对比-- 建表并插入数据CREATETABLEstore_sales_row(ss_sold_date_skINT,ss_item_skINT,ss_quantityINT);INSERTINTOstore_sales_rowSELECTgenerate_series(1,5000000),generate_series(1,5000000),1;-- 不加索引全表扫描3.6秒EXPLAINANALYZESELECT*FROMstore_sales_rowWHEREss_sold_date_sk2450944;-- 创建索引CREATEINDEXidx_sales_dateONstore_sales_row(ss_sold_date_sk);-- 加索引后走Index Scan13毫秒EXPLAINANALYZESELECT*FROMstore_sales_rowWHEREss_sold_date_sk2450944;SQL调优实战案例1索引优化——WHERE条件没走索引现象查询按某字段过滤但执行计划是Seq Scan全表扫描CREATEINDEXidx_orders_user_idONorders(user_id);CREATEINDEXidx_orders_created_atONorders(created_at);-- 复合索引多个条件同时过滤CREATEINDEXidx_orders_user_status_createdONorders(user_id,order_status,created_atDESC);-- 再次分析ANALYZEorders;提醒索引不是越多越好每个索引都会占用存储空间且写入时都要维护。一般建议在WHERE条件、JOIN关联列、ORDER BY排序列上建索引。案例2SQL改写——用EXISTS代替IN-- 慢子查询返回大量数据SELECT*FROMordersWHEREuser_idIN(SELECTuser_idFROMusersWHEREuser_statusblocked);-- 快EXISTS可以提前终止适合子表很大的情况SELECT*FROMorders oWHEREEXISTS(SELECT1FROMusers uWHEREu.user_ido.user_idANDu.user_statusblocked);案例3避免WHERE条件中使用函数-- 慢对created_at做DATE函数运算无法走索引SELECT*FROMordersWHEREDATE(created_at)2025-06-28;-- 快用范围查询可以走索引SELECT*FROMordersWHEREcreated_at2025-06-28 00:00:00ANDcreated_at2025-06-29 00:00:00;**GUC参数调优内存相关参数-- work_mem排序和Hash操作的内存默认512MB-- 复杂查询5-10个关联建议50%内存/10-- 并发场景串行值/并发数SETwork_mem2GB;-- maintenance_work_mem维护操作VACUUM、CREATE INDEX内存-- 建议不小于work_memSETmaintenance_work_mem2GB;-- shared_buffers共享内存建议内存的40%以内-- 行存表设大列存表设小SETshared_buffers8GB;并发控制参数-- max_active_statements全局并发队列-- 分析类查询设为CPU核数/DN个数一般是4-8SETmax_active_statements8;-- enable_dynamic_workload开启动态负载管理默认打开SETenable_dynamic_workloadon;查询优化开关-- 关闭排序归并强制走HashJoinSETenable_mergejoinoff;-- 关闭NestLoop避免小表驱动大表的低效关联SETenable_nestloopoff;-- 开启并行执行SMPSETquery_dop4;-- 并行度根据CPU核数设置问题原因解决方案1 查询总是跑得很慢没收集统计信息执行ANALYZE 表名;2 索引建了但不走数据分布不均匀优化器判断走全表更快更新统计信息ANALYZE或临时SET enable_seqscanoff;3 数据倾斜导致某节点特别慢分布键选得不合适用SELECT table_skewness(‘表名’);检查重新选分布键4 WDR报告生成失败 enable_wdr_snapshot没开 SET enable_wdr_snapshoton;5 大表JOIN特别慢关联列不是分布键大量数据重分布改写成先做INNER JOIN再LEFT JOIN的模式6 索引推荐给的方案不合理推荐合并了不该合并的索引

ModelEngine QA对生成技术：如何实现60%留用率的高质量训练数据

ModelEngine QA对生成技术：如何实现60%留用率的高质量训练数据【免费下载链接】modelengine ModelEngine provides a full-process toolchain for the AI domain, covering data processing, knowledge generation, as well as the development of AI-native appli…

📅 2026/6/30 4:26:52

minimax m3实际使用体验

实际使用体验，非软文 minimax Token Plan 连续包年，大约99每个月，18亿token，听着很香啊！ 调研了一天，最终还是决定上车！ 我原先一直是claude code deepseek v4 flash，听说minimax有…

📅 2026/6/30 4:26:52

Cybersources实战指南：Bug Bounty、二进制漏洞与CCTV安全自动化攻防

1. 项目概述：从“工具集”到“实战能力”的跃迁Cybersources，这个名字在安全圈里，尤其是那些活跃在漏洞赏金（Bug Bounty）和二进制安全研究领域的老手们听来，绝对不陌生。它不是一个单一的软件，而…

📅 2026/6/30 4:26:52

2026年上海楼道里的神秘追踪：管道井里的猫与狗故事

上海是一座高楼林立、弄堂密集的城市。可以说，每栋楼、每个小区的小角落都是宠物走失的高发地，尤其是那深邃的管道井里更是充满了神秘感。本报对上海多家专业寻宠团队进行了调研，其中有一家名叫“宠团圆”的本土老牌团队展现了惊人的寻宠成功…

📅 2026/6/30 5:41:56

IntelliJ IDEA 之偏好设置

打开设置界面5.2、设置外观主题如上图所示，本示例设置一个比较浅色的外观主题。5.3、设置文字大小如上图所示，可以设置使用鼠标滚轮改变编辑器中的文字大小。如上图所示，还可以手动设置文字大小、行高和字体。5.4、设置智能提示如上图所示&am…

📅 2026/6/30 5:41:56

医疗人工智能的Harness Engineering：面向安全、可控与合规的大模型系统工程（一）

摘要将大语言模型与 AI Agent 应用于临床场景，面临的核心挑战已从单纯的模型性能转向系统的可靠性、安全性与可监管性。本文提出“医疗 AI Harness Engineering”的概念，定义为在医疗大模型周围构建的一套包含上下文管理、工具调用、护栏、评估回路、可观测性与人机协同的可…

📅 2026/6/30 5:41:56

PHP代码审计实战：从str_replace过滤绕过到RCE漏洞利用

1. 项目概述：一次典型的PHP代码审计与RCE实战复盘最近在CTFShow平台上刷题，遇到了这道名为“web11”的题目，它完美地融合了代码审计、PHP特性利用和远程命令执行（RCE）的考点。这类题目在CTF的Web安全赛道中非常经典&am…

📅 2026/6/30 5:41:56

GitHub Actions + 阿里云 OSS：OIDC 免密同步构建产物

装包同步到阿里云 OSS，后续官网可以提供国内镜像链接。全程使用 OIDC 免密认证，不存长期 AccessKey。过程中遇到不少问题，带着 claude code 折腾了几个小时，才整好。下边是详细的过程记录。顺带说一句 Molio 在 github 上开源了&…

📅 2026/6/30 5:41:56

$单台Nginx部署多个前端项目：IP路径区分 \+ 域名区分完整实战$

单台Nginx部署多个前端项目：IP路径区分 \+ 域名区分完整实战

在日常开发、测试、内网生产环境中，我们经常遇到一个刚需场景：只有一台Nginx服务器，需要同时部署多个独立的Vue/React前端项目。很多新手会在这里产生困惑：服务器只有一个公网/内网IP，没有多个域名，怎么区…

📅 2026/6/30 5:36:56

如何永久备份微信聊天记录：本地化数据管理完全指南

如何永久备份微信聊天记录：本地化数据管理完全指南【免费下载链接】WeChatMsg 提取微信聊天记录，将其导出成HTML、Word、CSV文档永久保存，对聊天记录进行分析生成年度聊天报告项目地址: https://gitcode.com/GitHub_Trending/we/WeChatMs…

📅 2026/6/30 0:01:32

Mate Engine技术深度解析：开源VRM虚拟桌面伴侣的架构与实现

Mate Engine技术深度解析：开源VRM虚拟桌面伴侣的架构与实现【免费下载链接】Mate-Engine A free Desktop Mate alternative with a lightweight interface and custom VRM support, though with more features. 项目地址: https://gitcode.com/gh_mirrors/ma/Mat…

📅 2026/6/30 0:01:32

专业级Windows系统优化工具：WinUtil一站式自动化解决方案

专业级Windows系统优化工具：WinUtil一站式自动化解决方案【免费下载链接】winutil Chris Titus Techs Windows Utility - Install Programs, Tweaks, Fixes, and Updates 项目地址: https://gitcode.com/GitHub_Trending/wi/winutil Windows系统管理长期以来…

📅 2026/6/30 0:01:32

管理者的六个层次

📅 2026/6/29 7:54:50

AI Coding 六个月真实ROI账本：产品经理的血泪教训，研发的冷静忠告

6个月前的2025年12月，Boris Cherny 公开宣布自己卸载了 IDE。一时间，Vibe Coding 成了全行业最热的话题。6个月后，当我们回过头来拉一份真实账本，发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…

📅 2026/6/29 4:18:42

审计来了，数据权限全开——审计走了，怎么确保权限全部关掉？

引言：审计结束三个月了，审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间，内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中，审计…

📅 2026/6/29 4:18:42

相关新闻