diff --git a/aten/src/ATen/native/mkldnn/xpu/Attention.cpp b/aten/src/ATen/native/mkldnn/xpu/Attention.cpp
index 80010534883..89b69ec70dd 100644
--- a/aten/src/ATen/native/mkldnn/xpu/Attention.cpp
+++ b/aten/src/ATen/native/mkldnn/xpu/Attention.cpp
@@ -190,9 +190,7 @@ _scaled_dot_product_fused_attention_overrideable_xpu(
 
   auto opts = query.options();
   auto output = at::empty({batch_size, num_head, seq_len_q, head_dim}, opts);
-  // auto logsumexp =
-  //     at::empty({batch_size, num_head, seq_len_q}, opts.dtype(at::kFloat));
-  auto logsumexp = at::empty({}, opts.dtype(at::kFloat));
+  at::Tensor logsumexp, debug_attn_mask; // not supported
 
   at::native::onednn::gpu_float_sdpa(
       batch_size,
@@ -210,12 +208,9 @@ _scaled_dot_product_fused_attention_overrideable_xpu(
       scale.has_value() ? scale.value() : (1.0 / std::sqrt(head_dim)),
       output);
 
-  // rng and debug mask not used
+  // rng not used
   auto philox_seed = at::empty({}, at::dtype(at::kLong));
   auto philox_offset = at::empty({}, at::dtype(at::kLong));
-  auto debug_attn_mask = at::empty(
-      {batch_size, num_head, seq_len_q, seq_len_kv}, at::dtype(at::kFloat));
-
   return std::make_tuple(
       output,
       logsumexp,