马特 (Mateusz Kędzia)
+86 13552466785 / +31 622131620
mateusz.kedzia@gmail.com
求职意向
职位类型:AI/ML工程师 & 研究科学家
自我评价
经验丰富的AI工程师和机器学习专家,专注于开发自主智能体、大语言模型应用和可扩展AI系统。精通使用LangGraph和LangChain构建RAG架构,设计多模态AI解决方案,部署生产级AI工具。在我的学术和职业生涯中,我主导了涉及物联网数据处理、地理空间分析和商业AI产品开发的项目。我的工作涵盖从研究导向的机器学习系统到企业级AI应用,在提高运营效率和交付创新解决方案方面拥有丰富经验。热衷于推动AI技术发展,致力于自主系统和智能代理的前沿研究。
教育背景
2023.09 - 2025.08 | 阿姆斯特丹自由大学
人工智能专业,硕士学位
人工智能专业,硕士学位
2019.09 - 2023.08 | 阿姆斯特丹自由大学
人工智能专业,学士学位
人工智能专业,学士学位
语言能力
波兰语 (母语)
英语 (流利)
中文 (HSK2)
西班牙语 (基础)
荷兰语 (基础)
主要项目和成就
硕士论文:合成时空网约车交通知识图谱 (进行中) (2024.07-2025.03)
阿姆斯特丹自由大学 & 北京工业大学
Background: 城市交通研究需要先进的时空数据建模和分类方法。
Task: 开发和评估大规模时空知识图谱生成和轨迹分类算法。
Action: 基于GAN、LSTM-AE和SSVM设计和实现模型,进行全面基准测试。
Result: 推进城市交通数据分析前沿研究,为学术论文做出贡献。
Reflection: 深化了时空建模专业能力,增强了解决开放性研究问题的能力。
阿姆斯特丹自由大学 & 北京工业大学
Background: 城市交通研究需要先进的时空数据建模和分类方法。
Task: 开发和评估大规模时空知识图谱生成和轨迹分类算法。
Action: 基于GAN、LSTM-AE和SSVM设计和实现模型,进行全面基准测试。
Result: 推进城市交通数据分析前沿研究,为学术论文做出贡献。
Reflection: 深化了时空建模专业能力,增强了解决开放性研究问题的能力。
HedgeIoT: 物联网数据科学平台与机器学习工程 (2024.07-2024.09)
阿姆斯特丹自由大学
Background: 大学需要可扩展的协作物联网和机器学习研究平台。
Task: 作为研究助理,负责平台设计和部署,实施实时数据工作流。
Action: 构建和部署支持50+用户的Docker化JupyterHub平台,设计实时数据收集和机器学习管道,主导会议演示开发。
Result: 平台实现高效协作和实时数据分析,在HedgeIoT会议展示,支持50+研究人员。
Reflection: 增强了大规模系统设计、跨团队沟通和实用机器学习部署能力。
阿姆斯特丹自由大学
Background: 大学需要可扩展的协作物联网和机器学习研究平台。
Task: 作为研究助理,负责平台设计和部署,实施实时数据工作流。
Action: 构建和部署支持50+用户的Docker化JupyterHub平台,设计实时数据收集和机器学习管道,主导会议演示开发。
Result: 平台实现高效协作和实时数据分析,在HedgeIoT会议展示,支持50+研究人员。
Reflection: 增强了大规模系统设计、跨团队沟通和实用机器学习部署能力。
荷兰新闻档案网络爬虫 (2022.02-2025.03)
阿姆斯特丹大学
Background: 大规模研究需要高完整性新闻数据集。
Task: 开发高效网络爬虫进行自动化数据提取和结构化。
Action: 实施反屏蔽和相关性过滤算法,自动处理超过100万篇新闻文章。
Result: 实现99%数据完整性,为研究提供可靠数据集。
Reflection: 增强了自动化、数据质量保证和大规模数据工程能力。
阿姆斯特丹大学
Background: 大规模研究需要高完整性新闻数据集。
Task: 开发高效网络爬虫进行自动化数据提取和结构化。
Action: 实施反屏蔽和相关性过滤算法,自动处理超过100万篇新闻文章。
Result: 实现99%数据完整性,为研究提供可靠数据集。
Reflection: 增强了自动化、数据质量保证和大规模数据工程能力。
学士论文:异构物联网数据的可解释AI处理
阿姆斯特丹自由大学
Background: 整合多源物联网数据需要透明、可互操作和可解释的AI解决方案。
Task: 设计可解释模型和数据管道来统一异构物联网数据。
Action: 开发设备行为预测模型,基于RDF和SPARQL实施数据集成,确保模型可解释性。
Result: 交付稳健的物联网数据集成和预测系统,获得8.0分,展示了可解释AI和语义数据集成的实用价值。
Reflection: 加强了语义数据集成、时间序列预测和AI透明性基础。
阿姆斯特丹自由大学
Background: 整合多源物联网数据需要透明、可互操作和可解释的AI解决方案。
Task: 设计可解释模型和数据管道来统一异构物联网数据。
Action: 开发设备行为预测模型,基于RDF和SPARQL实施数据集成,确保模型可解释性。
Result: 交付稳健的物联网数据集成和预测系统,获得8.0分,展示了可解释AI和语义数据集成的实用价值。
Reflection: 加强了语义数据集成、时间序列预测和AI透明性基础。
技术技能
编程语言: Python (高级), Bash, SQL
机器学习与数据: PyTorch, TensorFlow, scikit-learn, XGBoost, Pandas, Polars, NumPy, Pydantic
AI智能体与LLM框架: LangGraph, LangChain, LangSmith, 提示工程, RAG系统, 多智能体编排
LLM开发与评估: 模型微调, 评估数据集创建, 性能基准测试, AI系统A/B测试
Web/API: FastAPI, Flask, Django, Streamlit
NLP与大模型: Transformers (自主开发), Hugging Face (语音检测, 图像转LaTeX), spaCy, NLTK, OpenAI API, Claude API
数据工程: GeoPandas, NetworkX, OSMnx, RDFlib, GraphDB, JupyterHub, Grafana, 向量数据库
DevOps: Docker, Docker Compose, NGINX, CI/CD, Linux (6年以上日常使用)
远程/高级: NVIM/LunarVim, Python多进程/多线程, LaTeX, Markdown
领导力与沟通
担任理学院学生会传播委员会主席:主持会议,分配任务,协调沟通。
主导实践课程并指导10+学生进行机器学习和数据项目。
主导实践课程并指导10+学生进行机器学习和数据项目。
核心课程
深度学习: 自定义CNN、DNN实现
自然语言处理: Transformers, Hugging Face, 高级NLP
数据挖掘技术: XGBoost排序, Kaggle竞赛
强化学习项目: 数据中心优化强化学习
对话机器人: 基于OpenAI API的对话智能体,在班级竞赛中获得第一名 (1/8队伍)
进化计算: 游戏AI的自定义进化算法