4 5 1

Bo Liu

Benjamin-eecs

https://benjamin-eecs.github.io/

Benjamin_eecs
Benjamin-eecs
bo-liu-eecs
benjamin-eecs.bsky.social

AI & ML interests

Reinforcement Learning, Reasoning, Machine Learning Systems

Recent Activity

upvoted a paper about 1 month ago

Self-rewarding correction for mathematical reasoning

liked a Space about 1 month ago

bigcomputer/SWE-Arena

authored a paper about 1 month ago

EnvPool: A Highly Parallel Reinforcement Learning Environment Execution Engine

View all activity

Organizations

Collections 1

Papers 7

models 2

Benjamin-eecs/Llama-3.1-8B-Instruct-NLRL-TicTacToe-Policy

Feature Extraction • Updated Nov 24, 2024 • 5

Benjamin-eecs/Llama-3.1-8B-Instruct-NLRL-TicTacToe-Value

Feature Extraction • Updated Nov 24, 2024 • 9

datasets

None public yet

Bo Liu

AI & ML interests

Recent Activity

Organizations

Collections 1

Natural Language Reinforcement Learning

Benjamin-eecs/Llama-3.1-8B-Instruct-NLRL-TicTacToe-Value

Benjamin-eecs/Llama-3.1-8B-Instruct-NLRL-TicTacToe-Policy

Waterhorse/Llama-3.1-8B-Instruct-NLRL-Breakthrough-Value

Papers 7

models 2

Benjamin-eecs/Llama-3.1-8B-Instruct-NLRL-TicTacToe-Policy

Benjamin-eecs/Llama-3.1-8B-Instruct-NLRL-TicTacToe-Value

datasets

Bo Liu

AI & ML interests

Recent Activity

Organizations

Collections 1

Papers 7

models 2 Sort: Recently updated

datasets

models 2