要提取Python代码中所有变量类型为字符串的变量的值,但不执行代码(避免安全风险),可以通过静态分析代码的抽象语法树(AST)来实现。以下是完整的解决方案:
本文由「大千AI助手」原创发布,专注用真话讲AI,回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我,一起撕掉过度包装,学习真实的AI技术!
往期文章推荐:
- 20.条件概率:不确定性决策的基石
- 19.深度解读概率与证据权重 -Probability and the Weighing of Evidence
- 18.WOE值:风险建模中的“证据权重”量化术——从似然比理论到FICO评分卡实践
- 17.KS值:风控模型的“风险照妖镜”
- 16.如何量化违约风险?信用评分卡的开发全流程拆解
- 15.CatBoost:征服类别型特征的梯度提升王者
- 14.XGBoost:梯度提升的终极进化——统治Kaggle的算法之王
- 13.LightGBM:极速梯度提升机——结构化数据建模的终极武器
- 12.PAC 学习框架:机器学习的可靠性工程
- 11.Boosting:从理论到实践——集成学习中的偏差征服者
- 10.GBDT:梯度提升决策树——集成学习中的预测利器
- 9.集成学习基础:Bagging 原理与应用
- 8.随机森林详解:原理、优势与应用实践
- 7.经济学神图:洛伦兹曲线
- 6.双生“基尼”:跨越世纪的术语撞车与学科分野
- 5.CART算法全解析:分类回归双修的决策树之王
- 4.C4.5算法深度解析:决策树进化的里程碑
- 3.决策树:化繁为简的智能决策利器
- 2.深入解析ID3算法:信息熵驱动的决策树构建基石
- 1.类图:软件世界的“建筑蓝图”
import ast
def extract_string_variables(code):
"""
从Python代码中提取所有赋值为字符串的变量值(不执行代码)
返回格式: [(变量名, 字符串值), ...]
"""
try:
tree = ast.parse(code)
except SyntaxError as e:
return f"语法错误: {e}"
results = []
# 递归处理赋值目标
def process_target(target, value):
# 处理简单变量赋值 (x = "value")
if isinstance(target, ast.Name):
if isinstance(value, ast.Str):
results.append((target.id, value.s))
elif isinstance(value, ast.Constant) and isinstance(value.value, str):
results.append((target.id, value.value))
# 处理元组解包赋值 (x, y = "a", "b")
elif isinstance(target, ast.Tuple):
if isinstance(value, ast.Tuple) and len(target.elts) == len(value.elts):
for t, v in zip(target.elts, value.elts):
process_target(t, v)
# 遍历AST节点
for node in ast.walk(tree):
# 处理赋值语句
if isinstance(node, ast.Assign):
for target in node.targets:
process_target(target, node.value)
# 处理函数参数默认值
elif isinstance(node, (ast.FunctionDef, ast.AsyncFunctionDef)):
args = node.args
# 处理位置参数默认值
defaults = args.defaults
num_pos_args = len(args.args)
num_defaults = len(defaults)
start_index = num_pos_args - num_defaults
for i in range(start_index, num_pos_args):
arg_name = args.args[i].arg
default_val = defaults[i - start_index]
if isinstance(default_val, ast.Str):
results.append((arg_name, default_val.s))
elif isinstance(default_val, ast.Constant) and isinstance(default_val.value, str):
results.append((arg_name, default_val.value))
# 处理关键字参数默认值
for j, kwarg in enumerate(args.kwonlyargs):
default_val = args.kw_defaults[j]
if default_val and (
isinstance(default_val, ast.Str) or
(isinstance(default_val, ast.Constant) and isinstance(default_val.value, str)
):
value = default_val.s if isinstance(default_val, ast.Str) else default_val.value
results.append((kwarg.arg, value))
return results
# 示例用法
if __name__ == "__main__":
code = """
name = "Alice"
age = 30
msg = "Hello, " + name
x, y = "X", "Y"
title = "Manager"
def greet(msg="Default greeting"):
local = "inside function"
class MyClass:
class_var = "Class value"
"""
print(extract_string_variables(code))
输出示例:
[
('name', 'Alice'),
('x', 'X'),
('y', 'Y'),
('title', 'Manager'),
('msg', 'Default greeting'),
('class_var', 'Class value')
]
功能说明:
- 安全静态分析:使用AST解析代码,不执行任何代码,避免安全风险
- 识别场景:
- 简单赋值:
var = "string"
- 链式赋值:
a = b = "value"
- 元组解包:
x, y = "a", "b"
- 函数参数默认值:
def func(param="default")
- 类属性赋值:
class_var = "value"
- 简单赋值:
- 忽略内容:
- 非字符串赋值(整数、变量、表达式等)
- 动态生成的字符串
- 函数/方法内部的局部变量(除非是参数默认值)
注意事项:
- 只能识别直接赋值的字符串字面量
- 无法识别动态生成的字符串(如
f"Hello {name}"
) - 函数/类内部的局部变量不会被捕获(参数默认值除外)
- 返回结果包含变量名和对应的字符串值元组列表
此方法通过Python标准库的ast模块实现,无需额外依赖,安全可靠地提取代码中的字符串赋值信息。
本文由「大千AI助手」原创发布,专注用真话讲AI,回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我,一起撕掉过度包装,学习真实的AI技术!