evstack · alpe · Mar 17, 2026 · Mar 17, 2026 · Mar 18, 2026 · Mar 18, 2026
diff --git a/.github/workflows/test.yml b/.github/workflows/test.yml
@@ -103,7 +103,16 @@ jobs:
       - name: Install just
         uses: extractions/setup-just@v3
       - name: E2E Tests
-        run: just test-e2e
+        run: |
+          mkdir -p .artifacts/e2e-server-logs
+          EV_E2E_LOG_DIR="${{ github.workspace }}/.artifacts/e2e-server-logs" just test-e2e
+      - name: Upload E2E server logs
+        if: failure()
+        uses: actions/upload-artifact@v7.0.0
+        with:
+          name: e2e-server-logs-${{ github.sha }}
+          path: ./.artifacts/e2e-server-logs
+          if-no-files-found: warn
 
   evm-tests:
     name: Run EVM Execution Tests

diff --git a/execution/evm/execution.go b/execution/evm/execution.go
@@ -756,24 +756,33 @@ func (c *EngineClient) reconcileExecutionAtHeight(ctx context.Context, height ui
 		// If we have a started execution with a payloadID, validate it still exists before resuming.
 		// After node restart, the EL's payload cache is ephemeral and the payloadID may be stale.
 		if execMeta.Stage == ExecStageStarted && len(execMeta.PayloadID) == 8 {
-			var pid engine.PayloadID
-			copy(pid[:], execMeta.PayloadID)
+			requestedTxHash := hashTxs(txs)
+			if execMeta.Timestamp != timestamp.Unix() || !bytes.Equal(execMeta.TxHash, requestedTxHash) {
+				c.logger.Warn().
+					Uint64("height", height).
+					Int64("execmeta_timestamp", execMeta.Timestamp).
+					Int64("requested_timestamp", timestamp.Unix()).
+					Msg("ExecuteTxs: ignoring stale in-progress execution for different block inputs")
+			} else {
+				var pid engine.PayloadID
+				copy(pid[:], execMeta.PayloadID)
 
-			// Validate payload still exists by attempting to retrieve it
-			if _, err = c.engineClient.GetPayload(ctx, pid); err == nil {
-				c.logger.Info().
+				// Validate payload still exists by attempting to retrieve it
+				if _, err = c.engineClient.GetPayload(ctx, pid); err == nil {
+					c.logger.Info().
+						Uint64("height", height).
+						Str("stage", execMeta.Stage).
+						Msg("ExecuteTxs: found in-progress execution with payloadID, returning payloadID for resume")
+					return nil, &pid, true, nil
+				}
+				// Payload is stale (expired or node restarted) - proceed with fresh execution
+				c.logger.Debug().
 					Uint64("height", height).
-					Str("stage", execMeta.Stage).
-					Msg("ExecuteTxs: found in-progress execution with payloadID, returning payloadID for resume")
-				return nil, &pid, true, nil
+					Str("payloadID", pid.String()).
+					Err(err).
+					Msg("ExecuteTxs: stale ExecMeta payloadID no longer valid in EL, will re-execute")
+				// Don't return - fall through to fresh execution
 			}
-			// Payload is stale (expired or node restarted) - proceed with fresh execution
-			c.logger.Debug().
-				Uint64("height", height).
-				Str("payloadID", pid.String()).
-				Err(err).
-				Msg("ExecuteTxs: stale ExecMeta payloadID no longer valid in EL, will re-execute")
-			// Don't return - fall through to fresh execution
 		}
 	}
 
@@ -1023,13 +1032,7 @@ func (c *EngineClient) saveExecMeta(ctx context.Context, height uint64, timestam
 	}
 
 	// Compute tx hash for sanity checks on retry
-	if len(txs) > 0 {
-		h := sha256.New()
-		for _, tx := range txs {
-			h.Write(tx)
-		}
-		execMeta.TxHash = h.Sum(nil)
-	}
+	execMeta.TxHash = hashTxs(txs)
 
 	if err := c.store.SaveExecMeta(ctx, execMeta); err != nil {
 		c.logger.Warn().Err(err).Uint64("height", height).Msg("saveExecMeta: failed to save exec meta")
@@ -1042,6 +1045,19 @@ func (c *EngineClient) saveExecMeta(ctx context.Context, height uint64, timestam
 		Msg("saveExecMeta: saved execution metadata")
 }
 
+func hashTxs(txs [][]byte) []byte {
+	if len(txs) == 0 {
+		return nil
+	}
+
+	h := sha256.New()
+	for _, tx := range txs {
+		h.Write(tx)
+	}
+
+	return h.Sum(nil)
+}
+
 // GetLatestHeight returns the current block height of the execution layer
 func (c *EngineClient) GetLatestHeight(ctx context.Context) (uint64, error) {
 	header, err := c.ethClient.HeaderByNumber(ctx, nil) // nil = latest block

diff --git a/execution/evm/execution_reconcile_test.go b/execution/evm/execution_reconcile_test.go
@@ -0,0 +1,130 @@
+package evm
+
+import (
+	"context"
+	"errors"
+	"math/big"
+	"testing"
+	"time"
+
+	"github.com/ethereum/go-ethereum/beacon/engine"
+	"github.com/ethereum/go-ethereum/core/types"
+	ds "github.com/ipfs/go-datastore"
+	dssync "github.com/ipfs/go-datastore/sync"
+	"github.com/rs/zerolog"
+	"github.com/stretchr/testify/require"
+)
+
+func TestReconcileExecutionAtHeight_StartedExecMeta(t *testing.T) {
+	t.Parallel()
+
+	specs := map[string]struct {
+		execMetaTimestamp int64
+		execMetaTxs       [][]byte
+		requestedTxs      [][]byte
+		requestedTime     time.Time
+		expectFound       bool
+		expectPayloadID   bool
+		expectGetPayloads int
+	}{
+		"resume_when_inputs_match": {
+			execMetaTimestamp: 1700000012,
+			execMetaTxs:       [][]byte{[]byte("tx-1")},
+			requestedTxs:      [][]byte{[]byte("tx-1")},
+			requestedTime:     time.Unix(1700000012, 0),
+			expectFound:       true,
+			expectPayloadID:   true,
+			expectGetPayloads: 1,
+		},
+		"ignore_when_timestamp_differs": {
+			execMetaTimestamp: 1700000010,
+			execMetaTxs:       [][]byte{[]byte("tx-1")},
+			requestedTxs:      [][]byte{[]byte("tx-1")},
+			requestedTime:     time.Unix(1700000012, 0),
+			expectFound:       false,
+			expectPayloadID:   false,
+			expectGetPayloads: 0,
+		},
+		"ignore_when_txs_differ": {
+			execMetaTimestamp: 1700000012,
+			execMetaTxs:       [][]byte{[]byte("tx-old")},
+			requestedTxs:      [][]byte{[]byte("tx-new")},
+			requestedTime:     time.Unix(1700000012, 0),
+			expectFound:       false,
+			expectPayloadID:   false,
+			expectGetPayloads: 0,
+		},
+	}
+
+	for name, spec := range specs {
+		t.Run(name, func(t *testing.T) {
+			t.Parallel()
+
+			store := NewEVMStore(dssync.MutexWrap(ds.NewMapDatastore()))
+			payloadID := engine.PayloadID{1, 2, 3, 4, 5, 6, 7, 8}
+			require.NoError(t, store.SaveExecMeta(t.Context(), &ExecMeta{
+				Height:    12,
+				PayloadID: payloadID[:],
+				TxHash:    hashTxs(spec.execMetaTxs),
+				Timestamp: spec.execMetaTimestamp,
+				Stage:     ExecStageStarted,
+			}))
+
+			engineRPC := &mockReconcileEngineRPCClient{
+				payloads: map[engine.PayloadID]*engine.ExecutionPayloadEnvelope{
+					payloadID: {},
+				},
+			}
+			client := &EngineClient{
+				engineClient: engineRPC,
+				ethClient:    mockReconcileEthRPCClient{},
+				store:        store,
+				logger:       zerolog.Nop(),
+			}
+
+			stateRoot, gotPayloadID, found, err := client.reconcileExecutionAtHeight(t.Context(), 12, spec.requestedTime, spec.requestedTxs)
+
+			require.NoError(t, err)
+			require.Nil(t, stateRoot)
+			require.Equal(t, spec.expectFound, found)
+			require.Equal(t, spec.expectPayloadID, gotPayloadID != nil)
+			if spec.expectPayloadID {
+				require.Equal(t, payloadID, *gotPayloadID)
+			}
+			require.Equal(t, spec.expectGetPayloads, engineRPC.getPayloadCalls)
+		})
+	}
+}
+
+type mockReconcileEngineRPCClient struct {
+	payloads        map[engine.PayloadID]*engine.ExecutionPayloadEnvelope
+	getPayloadCalls int
+}
+
+func (m *mockReconcileEngineRPCClient) ForkchoiceUpdated(_ context.Context, _ engine.ForkchoiceStateV1, _ map[string]any) (*engine.ForkChoiceResponse, error) {
+	return nil, errors.New("unexpected ForkchoiceUpdated call")
+}
+
+func (m *mockReconcileEngineRPCClient) GetPayload(_ context.Context, payloadID engine.PayloadID) (*engine.ExecutionPayloadEnvelope, error) {
+	m.getPayloadCalls++
+	payload, ok := m.payloads[payloadID]
+	if !ok {
+		return nil, errors.New("payload not found")
+	}
+
+	return payload, nil
+}
+
+func (m *mockReconcileEngineRPCClient) NewPayload(_ context.Context, _ *engine.ExecutableData, _ []string, _ string, _ [][]byte) (*engine.PayloadStatusV1, error) {
+	return nil, errors.New("unexpected NewPayload call")
+}
+
+type mockReconcileEthRPCClient struct{}
+
+func (mockReconcileEthRPCClient) HeaderByNumber(_ context.Context, _ *big.Int) (*types.Header, error) {
+	return nil, errors.New("header not found")
+}
+
+func (mockReconcileEthRPCClient) GetTxs(_ context.Context) ([]string, error) {
+	return nil, errors.New("unexpected GetTxs call")
+}
diff --git a/node/failover.go b/node/failover.go
@@ -33,6 +33,8 @@ type failoverState struct {
 	dataSyncService   *evsync.DataSyncService
 	rpcServer         *http.Server
 	bc                *block.Components
+	raftNode          *raft.Node
+	isAggregator      bool
 
 	// catchup fields — used when the aggregator needs to sync before producing
 	catchupEnabled bool
@@ -172,13 +174,34 @@ func setupFailoverState(
 		dataSyncService:   dataSyncService,
 		rpcServer:         rpcServer,
 		bc:                bc,
+		raftNode:          raftNode,
+		isAggregator:      isAggregator,
 		store:             rktStore,
 		catchupEnabled:    catchupEnabled,
 		catchupTimeout:    nodeConfig.Node.CatchupTimeout.Duration,
 		daBlockTime:       nodeConfig.DA.BlockTime.Duration,
 	}, nil
 }
 
+func (f *failoverState) shouldStartSyncInPublisherMode(ctx context.Context) bool {
+	if !f.isAggregator || f.raftNode == nil || !f.raftNode.IsLeader() {
+		return false
+	}
+
+	height, err := f.store.Height(ctx)
+	if err != nil {
+		f.logger.Warn().Err(err).Msg("cannot determine local height; keeping blocking sync startup")
+		return false
+	}
+	if height > 0 {
+		return false
+	}
+
+	f.logger.Info().
+		Msg("raft leader with empty store: starting sync services in publisher mode")
+	return true
+}
+
 func (f *failoverState) Run(pCtx context.Context) (multiErr error) {
 	stopService := func(stoppable func(context.Context) error, name string) { //nolint:contextcheck // shutdown uses context.Background intentionally
 		// parent context is cancelled already, so we need to create a new one
@@ -207,15 +230,28 @@ func (f *failoverState) Run(pCtx context.Context) (multiErr error) {
 	})
 
 	// start header and data sync services concurrently to avoid cumulative startup delay.
+	startSyncInPublisherMode := f.shouldStartSyncInPublisherMode(ctx)
 	syncWg, syncCtx := errgroup.WithContext(ctx)
 	syncWg.Go(func() error {
-		if err := f.headerSyncService.Start(syncCtx); err != nil {
+		var err error
+		if startSyncInPublisherMode {
+			err = f.headerSyncService.StartForPublishing(syncCtx)
+		} else {
+			err = f.headerSyncService.Start(syncCtx)
+		}
+		if err != nil {
 			return fmt.Errorf("header sync service: %w", err)
 		}
 		return nil
 	})
 	syncWg.Go(func() error {
-		if err := f.dataSyncService.Start(syncCtx); err != nil {
+		var err error
+		if startSyncInPublisherMode {
+			err = f.dataSyncService.StartForPublishing(syncCtx)
+		} else {
+			err = f.dataSyncService.Start(syncCtx)
+		}
+		if err != nil {
 			return fmt.Errorf("data sync service: %w", err)
 		}
 		return nil

diff --git a/pkg/store/cached_store.go b/pkg/store/cached_store.go
@@ -174,3 +174,8 @@ func (cs *CachedStore) Close() error {
 	cs.ClearCache()
 	return cs.Store.Close()
 }
+
+// Sync flushes the underlying store to durable storage.
+func (cs *CachedStore) Sync(ctx context.Context) error {
+	return cs.Store.Sync(ctx)
+}
diff --git a/pkg/store/store.go b/pkg/store/store.go
@@ -6,6 +6,7 @@ import (
 	"encoding/binary"
 	"errors"
 	"fmt"
+	"time"
 
 	ds "github.com/ipfs/go-datastore"
 	"google.golang.org/protobuf/proto"
@@ -30,7 +31,21 @@ func New(ds ds.Batching) Store {
 
 // Close safely closes underlying data storage, to ensure that data is actually saved.
 func (s *DefaultStore) Close() error {
-	return s.db.Close()
+	done := make(chan error, 1)
+	go func() {
+		syncCtx, cancel := context.WithTimeout(context.Background(), 2*time.Second)
+		defer cancel()
+
+		_ = s.Sync(syncCtx)
+		done <- s.db.Close()
+	}()
+
+	select {
+	case err := <-done:
+		return err
+	case <-time.After(4 * time.Second):
+		return nil
-	done := make(chan error, 1)
-	go func() {
-		syncCtx, cancel := context.WithTimeout(context.Background(), 2*time.Second)
-		defer cancel()
-
-		_ = s.Sync(syncCtx)
-		done <- s.db.Close()
-	}()
-
-	select {
-	case err := <-done:
-		return err
-	case <-time.After(4 * time.Second):
-		return nil
+	done := make(chan error, 1)
+	go func() {
+		syncCtx, cancel := context.WithTimeout(context.Background(), 2*time.Second)
+		defer cancel()
+
+		syncErr := s.Sync(syncCtx)
+		closeErr := s.db.Close()
+
+		switch {
+		case syncErr != nil && closeErr != nil:
+			done <- errors.Join(
+				fmt.Errorf("sync store before close: %w", syncErr),
+				fmt.Errorf("close datastore: %w", closeErr),
+			)
+		case syncErr != nil:
+			done <- fmt.Errorf("sync store before close: %w", syncErr)
+		default:
+			done <- closeErr
+		}
+	}()
+
+	select {
+	case err := <-done:
+		return err
+	case <-time.After(4 * time.Second):
+		return fmt.Errorf("closing datastore timed out after 4s")
+	}
-	done := make(chan error, 1)
-	go func() {
-		syncCtx, cancel := context.WithTimeout(context.Background(), 2*time.Second)
-		defer cancel()
-
-		_ = s.Sync(syncCtx)
-		done <- s.db.Close()
-	}()
-
-	select {
-	case err := <-done:
-		return err
-	case <-time.After(4 * time.Second):
-		return nil
+	done := make(chan error, 1)
+	go func() {
+		syncCtx, cancel := context.WithTimeout(context.Background(), 2*time.Second)
+		defer cancel()
+
+		syncErr := s.Sync(syncCtx)
+		closeErr := s.db.Close()
+
+		switch {
+		case syncErr != nil && closeErr != nil:
+			done <- errors.Join(
+				fmt.Errorf("sync store before close: %w", syncErr),
+				fmt.Errorf("close datastore: %w", closeErr),
+			)
+		case syncErr != nil:
+			done <- fmt.Errorf("sync store before close: %w", syncErr)
+		default:
+			done <- closeErr
+		}
+	}()
+
+	select {
+	case err := <-done:
+		return err
+	case <-time.After(4 * time.Second):
+		return fmt.Errorf("closing datastore timed out after 4s")
+	}
+	}
 }
 
 // Height returns height of the highest block saved in the Store.

diff --git a/pkg/store/store_test.go b/pkg/store/store_test.go
@@ -35,6 +35,22 @@ type mockBatch struct {
 	commitError error
 }
 
+type syncingBatchingDatastore struct {
+	ds.Batching
+	syncCalled  bool
+	closeCalled bool
+}
+
+func (m *syncingBatchingDatastore) Sync(ctx context.Context, key ds.Key) error {
+	m.syncCalled = true
+	return m.Batching.Sync(ctx, key)
+}
+
+func (m *syncingBatchingDatastore) Close() error {
+	m.closeCalled = true
+	return m.Batching.Close()
+}
+
 func (m *mockBatchingDatastore) Put(ctx context.Context, key ds.Key, value []byte) error {
 	if m.putError != nil {
 		return m.putError
@@ -141,6 +157,20 @@ func TestStoreHeight(t *testing.T) {
 	}
 }
 
+func TestStoreCloseSyncsBeforeClose(t *testing.T) {
+	t.Parallel()
+
+	kv, err := NewTestInMemoryKVStore()
+	require.NoError(t, err)
+
+	mock := &syncingBatchingDatastore{Batching: kv}
+	s := New(mock)
+
+	require.NoError(t, s.Close())
+	require.True(t, mock.syncCalled)
+	require.True(t, mock.closeCalled)
+}
+
 func TestStoreLoad(t *testing.T) {
 	t.Parallel()
 	chainID := "TestStoreLoad"