Recsys Hub

← Back to Library

Live Session

Chamber of Commerce

Poster

16 Oct

8:00

CEST

Wednesday Posters

Add Session to Calendar 2024-10-16 08:00 am 2024-10-16 05:30 pm Europe/Rome Wednesday Posters Wednesday Posters is taking place on the RecSys Hub. Https://recsyshub.org

Industry Poster

Improving Data Efficiency for Recommenders and LLMs

View on ACM Digital Library

Noveen Sachdeva (Google DeepMind), Benjamin Coleman (Google DeepMind), Wang-Cheng Kang (Google DeepMind), Jianmo Ni (Google DeepMind), James Caverlee (Texas A&M University), Lichan Hong (Google DeepMind), Ed Chi (Google DeepMind) and Derek Cheng (Google DeepMind)

View Paper PDF View Poster

Abstract

In recent years, massive transformer-based architectures have driven breakthrough performance in practical applications like autoregressive text-generation (LLMs) and click-prediction (recommenders). A common recipe for success is to train large models on massive web-scale datasets, e.g., modern recommenders are trained on billions of user-item click events, and LLMs are trained on trillions of tokens extracted from the public internet. We are close to hitting the computational and economical limits of scaling up the size of these models, and we expect the next frontier of gains to come from improving the: (i) data quality of the training dataset, and (ii) data efficiency of the extremely expensive training procedure. Inspired by this shift, we present a set of “data-centric” techniques for recommendation and language models that summarizes a dataset into a terse data summary, which is both (i) high-quality, i.e., trains better quality models, and (ii) improves the data-efficiency of the overall training procedure. We propose techniques from two disparate data frameworks: (i) data selection (a.k.a., coreset construction) methods that sample portions of the dataset using grounded heuristics, and(ii) data distillation techniques that generate synthetic examples which are optimized to retain the signals needed for training high-quality models. Overall, this work sheds light on the challenges and opportunities offered by data optimization in web-scale systems, a particularly relevant focus as the recommendation community grapples with the grand challenge of leveraging LLMs.

Join the Conversation

Head to Slido and select the paper's assigned session to join the live discussion.

Conference Agenda

View Full Agenda →

8:00

CEST

Monday Registration and Badge Pick-Up

9:00

CEST

CARS: Workshop on Context-Aware Recommender Systems

9:00

CEST

CONSEQUENCES: The 3rd Workshop on Causality, Counterfactuals and Sequential Decision-Making for Recommender Systems

9:00

CEST

Doctoral Symposium

9:00

CEST

FAccTRec 2024: The 7th Workshop on Responsible Recommendation

9:00

CEST

MuRS2024: 2nd Music Recommender Systems Workshop

9:00

CEST

RecSys Challenge

9:00

CEST

SURE 2024: Workshop on Strategic and Utility-aware Recommendation

9:00

CEST

Tutorial: Computational Methods for Designing Human-Centered Recommender Systems: A Case Study Approach Intersecting Visual Arts and Healthcare

9:00

CEST

Tutorial: Deep Recommendation using Graphs

9:00

CEST

VideoRecSys + LargeRecSys 2024

10:30

CEST

Monday AM Coffee Break

12:45

CEST

Monday Lunch

14:30

CEST

RecSys in HR 2024: Fourth Workshop on Recommender Systems for Human Resources

14:30

CEST

RecTemp: Temporal Reasoning in Recommendation Systems

14:30

CEST

Tutorial: A Tutorial on Feature Interpretation in Recommender Systems

14:30

CEST

Tutorial: Economics of Recommender Systems

16:00

CEST

Monday PM Coffee Break

19:00

CEST

Welcome Reception

8:00

CEST

Tuesday Posters

8:00

CEST

Tuesday Registration and Badge Pick-Up

9:00

CEST

RecSys Welcome and Opening

9:30

CEST

Keynote: Mark Riedl

10:15

CEST

Session 1: Large Language Models 1

11:00

CEST

Google Sponsor Meet Up

11:00

CEST

Huawei Sponsor Meet Up

11:00

CEST

Tuesday AM Break

12:00

CEST

Session 2: Bias and Fairness 1

13:15

CEST

Tuesday Lunch Break (on own)

14:30

CEST

Session 3: Bias and Fairness 2

15:15

CEST

Session 4: Collaborative Filtering

16:25

CEST

Huawei Sponsor Meet Up

16:25

CEST

IBM Sponsor Meet Up

16:25

CEST

Tuesday PM Break

17:20

CEST

Session 5: Cross-domain and Cross-modal Learning

8:00

CEST

Wednesday Posters

8:00

CEST

Wednesday Registration and Badge Pick-Up

8:30

CEST

Session 6: Multi-task Learning

9:30

CEST

Session 7: Cold Start

10:25

CEST

Session 8: Sequential Recommendation 1

11:05

CEST

Amazon Science Sponsor Meet Up

11:05

CEST

Netflix Sponsor Meet Up

11:05

CEST

Wednesday AM Break

12:00

CEST

Session 9: Sequential Recommendation 2

13:10

CEST

Wednesday Lunch Break (On Own)

14:30

CEST

Keynote: Michael I. Jordan

15:15

CEST

Session 10: Graph Learning

16:20

CEST

Google Sponsor Meet Up

16:20

CEST

Wednesday PM Break

17:20

CEST

Session 11: Optimisation and Evaluation 1

20:00

CEST

Social Event

8:00

CEST

Thursday Posters

8:00

CEST

Thursday Registration and Badge Pick-Up

8:00

CEST

Women in RecSys Breakfast

9:00

CEST

Keynote: Mounia Lalmas

9:45

CEST

Session 12: Optimisation and Evaluation 2

10:35

CEST

Session 13: Robust RecSys 1

10:55

CEST

PopRox Meeting (PRIVATE)

10:55

CEST

Thursday AM Break

11:00

CEST

Booking.com Sponsor Meet Up

11:00

CEST

OVS Sponsor Meet Up

12:00

CEST

Session 14: Robust RecSys 2

12:30

CEST

Session 15: Off-policy Learning

13:15

CEST

Thursday Lunch Break (On Own)

14:30

CEST

Session 16: Large Language Models 2

16:20

CEST

Thursday PM Break

17:10

CEST

Session 17: Women in RecSys

18:10

CEST

Closing

21:00

CEST

Erasmus Orchestra Concert

8:00

CEST

Friday Registration and Badge Pick-Up

9:00

CEST

HealthRecSys: 6th ACM RecSys Workshop on Health Recommender Systems

9:00

CEST

INRA: 12th International Workshop on News Recommendation and Analytics

9:00

CEST

INTROSPECTIVES: Reflections on Recommender Systems Past, Present, and Future

9:00

CEST

IntRS 2024: 11th Joint Workshop on Interfaces and Human Decision Making for Recommender Systems

9:00

CEST

KaRS: Sixth Knowledge-aware and Conversational Recommender Systems Workshop

9:00

CEST

NORMalize: The Second Workshop on Normative Design and Evaluation of Recommender Systems

9:00

CEST

ROEGEN: The 1st International Workshop on Risks, Opportunities, and Evaluation of Generative Models in Recommendation

9:00

CEST

RecSoGood 2024: First International Workshop on Recommender Systems for Sustainability and Social Good

9:00

CEST

RecTour: Workshop on Recommenders in Tourism

9:00

CEST

Tutorial: Conducting User Experiments in Recommender Systems

10:30

CEST

Friday AM Coffee Break

11:00

CEST

Tutorial: Conducting Recommender Systems User Studies Using POPROX

12:30

CEST

Friday Lunch

14:15

CEST

AltRecSys: A Workshop on Alternative, Unexpected, and Critical Work on Recommendation

14:15

CEST

EARL: Workshop on Evaluating and Applying Recommendation Systems with Large Language Models

14:15

CEST

RobustRecSys @ RecSys2024: Design, Evaluation and Deployment of Robust Recommender Systems

15:45

CEST

Friday PM Coffee Break

No items found.